
AI가 영상 속 사회적 단서를 '사람처럼' 읽는다? 최근 투르쿠 대학의 연구는 GPT-4V(시각 확장형 모델)가 이미지·영상에서 138개 사회적 특성을 인간 수준으로 평가했다는 결과를 제시합니다. 본문은 연구 요지, 실제 응용, 윤리적 쟁점과 향후 방향까지 쉽게 정리합니다.우리는 매일 얼굴 표정, 몸짓, 상호작용의 맥락을 읽으며 타인의 감정과 의도를 해석합니다. 그런데 이제 인공지능이 영상에서 그런 '사회적 단서'를 거의 사람처럼 읽어낼 수 있다는 연구가 나왔습니다. 이 글에서 저와 함께 연구의 핵심과 실무적 의미를 차근히 풀어보겠습니다. 😊원문 보기 (PMC) 대학 보도자료배경: 왜 '사회적 단서' 인식이 중요한가?사회적 단서(social cues)는 표정, 시선, 제스처, 상호작용의 구조 등으로 구..