AI 그림 학습데이터의 저작권문제가 항상 논란이 되는데 실제 이런문제를 해결하고자 저작권이 해결된 그림으로만 학습한 모델이 없는것도 아니다.
그중 CommonCanvas 모델은 특정 조건을 지키는 경우 합법적으로 사용 라이선스가 부여되는 Creative Commons 라이선스 사진으로 학습된 모델로서 총 4가지 모델이 준비되어 있다.
CommonCanvas-S-C - 상업적 용도 사용이 가능한 SD 2 아키텍처 모델 (CC-BY-SA-4.0)
CommonCanvas-S-NC - 상업적 용도 사용이 불가능한 SD 2 아키텍처 모델 (CC-BY-NC-SA-4.0)
CommonCanvas-XL-C - 상업적 용도 사용이 가능한 SDXL 아키텍처 모델 (CC-BY-SA-4.0)
CommonCanvas-XL-NC - 상업적 용도 사용이 불가능한 SDXL 아키텍처 모델 (CC-BY-NC-SA-4.0)
그럼에도 불구하고 왜 이러한 시도가 잘 안되고 있는가?
이 모델을 통해 생성된 그림들을 한번 살펴보자.
이상이 위 모델로 생성된 그림들이다.그림 AI 수준이 다시 5년은 족히 퇴화한듯한 끔찍한 수준을 보여준다..저작권을 해결해서 상업적 이용조차 가능하다고 하지만 이따위 퀄리티에 돈쓸 사람은 없다.
즉 저작권이 해결된 그림으로만 학습시키고자 하면 학습량이 끔찍하게 적어지기 때문에 심각한 퍼포먼스의 저하가 동반될수밖에 없음.
그리고 사실 이건 굳이 그림AI뿐만 아니라 모든 AI에게 통용되는건데 AI는 학습량이 많아지면 많아질수록 성능이 올라가기 때문에 무조건 많은 데이터가 필수적임에도 저작권이 해결된 데이터로만 학습시킬려고 하면 데이터의 부족으로 인한 성능저하를 피할수가 없다...
결국 AI학습에 대한 전면적인 면책권이 없다면 AI의 기술적 발전과는 별개로 수익성이 의심될수밖에 없음.지금 긴빠이한 학습데이터 때문에 제대로된 상업적 이용이 어렵고 따라서 상업성이 저하되니까.그렇게 되면 AI기대감으로 오른 것도 유지가 불가능함.그게 AI버블이라는거고.
과연 국가는 AI 발전과 저작권중 어느것의 손을 들어주게 될까?
Copyright ⓒ 유머톡톡 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.