검색 기술의 진화 '구글 렌즈'...사진 찍으면 원하는 정보 얻는다 VIDEO: How Google plans to improve web searches with multimodal AI
멀티태스킹 통합 모델(MUM)
텍스트, 이미지, 영상 동시 처리
다중 모드 검색 Multimodal search
"이걸 어떻게 고쳐야 하나"라는 질문이 주어졌을 때,
MUM은 수리하는 방법 보여줘
오늘날 구글은 AI 기술, 특히 멀티태스킹 통합 모델(MUM)이라고 불리는 기계 학습 알고리즘을 사용하여 다양한 언어와 장치에서 웹 검색 경험을 향상시키는 방법을 자세히 알려왔다. 이 회사의 이미지 인식 기술인 구글 렌즈는 내년 초부터 사진과 높은 수준의 설명을 바탕으로 의류와 같은 물체를 찾을 수 있는 능력을 갖게 될 것이다.
비슷한 시기에, 구글 검색 사용자들은 아크릴 페인트 재료와 같은 특정 주제에 대해 알아야 할 것들에 대해 인공지능으로 정렬된 목록을 보기 시작할 것이다. 또한 검색을 통해 검색된 비디오의 관련 항목뿐만 아니라 해당 주제에 따라 검색을 세분화하거나 확장하기 위한 제안도 볼 수 있다.
이러한 업그레이드는 언어가 웹의 시각 자료와 어떻게 관련되는지에 대한 검색과 렌즈의 이해를 향상시키기 위한 구글의 다년간의 노력의 산물이다. 검색 판두 나약의 구글 부사장에 따르면, 지난 6월 구글이 개발자 컨퍼런스에서 자세히 설명한 MUM은 고객 서비스 수준이나 연구 환경에서 제품 및 리뷰를 표면화하고 "모든" 종류의 언어 이해를 향상시킴으로써 사용자들을 기업들과 더 잘 연결시킬 수 있도록 도울 수 있다.
"MUM의 힘은 정보를 폭넓게 이해하는 능력이다. 본질적으로 다중 모드다. 즉, 텍스트, 이미지, 비디오를 동시에 처리할 수 있다."라고 Nayak은 VentureBeat와의 전화 인터뷰에서 말했다. "이것은 우리가 매우 복잡한 질의를 할 수 있고 그것들을 일련의 단순한 구성 요소들로 나눌 수 있다는 약속을 보여준다. 다양하고 단순한 질의를 위한 결과를 얻고 정말로 원하는 것을 이해하기 위해 그것들을 함께 연결할 수 있다."
멀티태스킹 통합 모델(MUM)
구글은 사용자들이 궁극적으로 볼 수 있는 결과를 미세 조정하기 위해 검색에서 많은 테스트를 시행한다. 이 회사는 3,600개 이상의 새로운 기능을 출시한 해인 2020년에 17,500개 이상의 트래픽 실험과 383,600개 이상의 품질 감사를 실시했다고 Nayak은 말한다.
그러나 언어의 복잡한 특성을 감안할 때, 문제들이 갑자기 발생한다. 예를 들어, 몇 년 전 "아이들에게만 좋은가"라는 검색에서, 이 경우에는 물고기를 가리키는 "솔"이 아이들의 신발을 비교하는 웹페이지가 나타났다.
2019년, 구글은 트랜스포머의 양방향 인코더 표현 또는 BERT라고 불리는 기술로 언어 모호성 문제를 해결하기 시작했다. 트랜스포머 모델 아키텍처에 대한 회사의 연구를 바탕으로, BERT는 모델들이 단어의 앞과 뒤에 오는 단어들을 살펴봄으로써 단어의 맥락을 고려하도록 강요한다.
2017년으로 거슬러 올라가는 트랜스포머는 문서를 요약하고, 언어 간 번역하고, 생물학적 순서를 분석하는 능력을 보여주면서 자연어 작업을 위한 선택의 아키텍처가 되었다. 구글에 따르면, BERT는 미국 내 질의의 10%를 영어로 더 잘 이해하는데 도움을 주었다. 특히 "for"와 "to"와 같은 전치사가 의미에 매우 중요한 더 길고 더 많은 대화 검색을 했다.
예를 들어, 구글의 이전 검색 알고리즘은 "2019 브라질 미국 여행자는 비자가 필요하다"는 것이 브라질인 미국 여행에 관한 것이지 그 반대는 아니라는 것을 이해하지 못할 것이다. 문맥에서 "to"라는 단어의 중요성을 깨닫는 BERT와 함께, 구글 검색은 쿼리에 더 적절한 결과를 제공한다.
다중 모드 검색 Multimodal search
2020년 MUM이 해결할 수 있는 질의 유형을 보기 위해 내부 파일럿을 거친 후, 구글은 MUM을 검색의 다른 코너로 확장하고 있다고 말한다.
곧, MUM은 렌즈로 물체(예: 셔츠)의 사진을 찍고 웹에서 유사한 패턴의 다른 물체(예: 양말)를 검색할 수 있게 할 것이다. MUM은 또한 렌즈가 자전거의 후면 스프로켓과 같이 검색자에게 익숙하지 않은 물체를 식별하고 쿼리에 따라 검색 결과를 반환할 수 있게 할 것이다. 예를 들어, 스프로켓의 사진과 "이걸 어떻게 고쳐야 하나"라는 질문이 주어졌을 때, MUM은 자전거 스프로켓을 수리하는 방법에 대한 지침을 보여줄 것입니다.
황기철 콘페이퍼 에디터
Ki Chul Hwang Conpaper editor
(Source:
https://venturebeat.com/2021/09/29/how-google-plans-to-improve-web-searches-with-multimodal-ai/)
Google MUM MultiTask 통합 모델 소개
kcontents