✺
지난 새벽에 오픈AI에서 새로운 GPT-4o 모델을 공개했다. 여기서 'o'는 '옴니(omni)'로 사전적 의미는 '모든 것'이다. 텍스트, 오디오, 이미지 인식을 모두 통합해 상호작용이 가능한 멀티모달(Multimodal, 다중 모드)이라는 점에서 너무나도 잘 어울리는 네이밍이다. 기존 GPT-4와 어떤 차이가 있을까? 오픈AI가 각종 기능을 시연한 영상에서 가장 눈에 띄는 점은 사용자와 실시간으로 음성을 통해 대화를 주고받는 모습이다. 물론 기존에도 음성 모드를 지원했었지만, 대답 속도가 약 5.4초로 느렸지만, GPT-4o에서는 평균 320ms 안에 답변을 한다. 이는 실제 사람과의 대화 속도와 비슷한 수준이라고 한다. 하.......
Continue reading ...