[정규원 칼럼] AI는 인간의 감정을 토대로 예술을 생성할 수 있을까?: 인간의 음성으로 이미지를 생성하는 사례②에 이어
[문화매거진=정규원 작가] 우리는 이제 목소리만으로도 그림을 만들 수 있는 시대에 서 있다. ‘Art Generation Using Speech Emotions’ 같은 프로젝트는 인간의 음성을 단순한 의사소통 도구가 아니라, 예술적 재료로 변환해냈다. 그렇다면 이런 기술은 앞으로 어디로 향할까? 단순히 ‘재미있는 실험’을 넘어선 그다음의 질문들이 우리를 기다린다.
첫째, 예술의 주체성 문제다. 지금까지 예술은 “누가 그렸는가”라는 질문과 긴밀히 얽혀 있었다. 하지만 음성을 기반으로 한 예술 생성에서는 사용자는 감정을 제공할 뿐, 실제 붓질은 알고리즘이 맡는다. 그렇다면 최종 작품의 저작권은 누구에게 돌아가야 할까? 목소리를 낸 사람일까, 모델을 설계한 연구자일까, 아니면 단순히 데이터와 수학적 변환의 산물로 간주해야 할까? 이 문제는 곧 디지털 아트 시장과 NFT 같은 새로운 유통 구조에도 직결된다.
둘째, 감정 데이터의 민감성이다. 목소리에는 단순한 단어 이상의 정보가 담긴다. 떨림, 속도, 호흡의 길이 등이 개인의 심리 상태와 연결된다. 만약 이런 데이터가 무분별하게 수집 및 활용된다면, 개인의 사적 감정까지도 상업적으로 소비될 위험이 있다. 즉, 감정을 예술의 원천으로 삼는 기술은 동시에 감정을 상품화하는 통로가 될 수 있다. 우리는 감정 기반 창작을 즐기면서도, 그 이면에 존재하는 윤리적 경계를 분명히 짚어야 한다.
셋째, 새로운 창작 방식의 탄생이다. 음성 감정 기반 예술은 ‘사용자가 예술가와 협업하는 새로운 장르’를 열어줄 수 있다. 공연 예술을 떠올려보자. 가수의 무대에서 관객의 환호와 호흡이 AI에게 실시간 입력되어, 즉석에서 배경 시각 효과가 감정에 따라 변화한다면 어떨까? 혹은 심리 상담에서 상담자의 목소리를 기반으로 즉각적인 그림이나 영상이 만들어져 감정 피드백 도구로 쓰일 수도 있다. 이는 단순한 그림 생성기를 넘어, 상호작용적 예술로 확장될 가능성을 보여준다.
마지막으로, 문화적 다양성에 대한 시사점이다. 앞서 언급했듯이 전 세계 언어의 절반은 문자로 기록되지 않는다. 문자 없는 언어 공동체에서도 목소리는 늘 존재했다. 따라서 이 기술은 문자 중심의 창작 방식을 넘어, 비문자 문화권에서도 감정을 시각적으로 기록하고 공유할 수 있는 도구가 될 수 있다. 이는 언어 장벽을 뛰어넘는 예술적 소통 수단이 될지도 모른다.
결국 ‘Art Generation Using Speech Emotions’ 같은 프로젝트는 “AI가 그림을 잘 그릴 수 있느냐”를 넘어 “예술이란 무엇인가, 감정을 어떻게 다루어야 하는가”라는 근본적인 질문으로 결국 우리를 이끈다. 목소리의 흔적이 그림이 되는 이 실험은 아직 미완성이지만, 분명 미래 예술의 풍경을 바꿀 시작점이다. 그리고 그 시작을 어떻게 이어갈지는 기술 그 자체보다 우리가 어떤 태도로 감정과 예술을 대하느냐에 달려 있다.
Copyright ⓒ 문화매거진 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.