마이크로소프트(MS)가 지난달 공개한 소형언어모델(SLM) 파이-3(Phi-3)에 비전(Vision) 기능을 추가했다 .
파이-3 비전은 멀티모달 기능이 탑재돼, AI가 이미지를 읽을 수 있게 됐다.
거대언어모델(LLM)과 같이 이미지를 생성하진 않지만, 이미지 내용을 제대로 이해하고 사용자를 위해 분석할 수 있다는 것이다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “AI포스트” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.