Sign In
테크 소식

모시(Moshi): GPT-4에 도전장을 내민 오픈소스 음성 AI

Last modified
• 프랑스 파리 연구소 개발
• 음성 입력-출력 지원 오픈소스 모델
• 70가지 감정/스타일 표현
• 8인 팀, 6개월 만에 구현
• 웹 데모로 직접 체험 가능
• 향후 완전 오픈소스화 예정
모시(Moshi)는 GPT-4의 음성 기능에 대항할 수 있는 첫 오픈소스 모델로 주목받고 있다. 프랑스 파리의 연구소에서 개발한 이 AI는 음성 입력과 출력을 모두 지원하며, 놀라운 속도로 응답한다.
주요 특징:
1.
다양한 표현: 70가지 감정과 스타일 구현 가능
2.
빠른 개발: 8명의 연구원이 6개월 만에 프로토타입 완성
3.
낮은 지연시간: 실시간 대화에 적합한 빠른 응답 속도
4.
확장성: 8비트 및 4비트 양자화로 다양한 환경 지원
모시 체험하기:
모시는 현재
https://kyutai.org/ 에서 웹 데모로 체험할 수 있다. 주요 특징은 다음과 같다:
실험적 대화형 AI로, 응답의 정확성을 보장하지 않음
대화 시간은 5분으로 제한
동시에 생각하고 말하는 기능 구현
지속적인 음성 입력과 출력으로 자연스러운 대화 흐름 제공
해적 역할극, 라자냐 요리법, 최근 본 영화 등 다양한 주제로 대화 가능
크롬 브라우저에서 최적화된 성능 제공
위치에 따라 EU 데모 서버가 더 나은 응답 속도를 제공할 수 있음
개발팀은 곧 기술 보고서와 함께 7B 파라미터 모델, 오디오 코덱, 최적화된 스택을 포함한 전체 코드베이스를 공개할 예정이다.
이 모델의 등장은 AI 음성 기술의 민주화를 예고한다. 향후 로컬 설치가 가능해지면, 개인용 컴퓨터에서도 고성능 AI 음성 비서를 구현할 수 있을 것으로 전망된다.
모시의 오픈소스 전략은 Mistral AI의 성공 사례를 따르고 있다. 이는 AI 기술 발전의 가속화와 함께, 대기업 독점에서 벗어나 더 넓은 개발자 커뮤니티의 참여를 유도할 것으로 기대된다. 모시의 발전은 AI 음성 기술 분야에 새로운 혁신의 바람을 일으킬 것으로 보인다.
Subscribe to '오늘배움'
Subscribe to my site to be the first to receive notifications and emails about the latest updates, including new posts.
Join Slashpage and subscribe to '오늘배움'!
Subscribe
1
👍
곽효길
빠른 뉴스에 감사해요. 현재 영어만 가능한 것 같고, 프랑스어, 중국어, 일본어는 배우고 있다고 답하네요.
See latest comments
문의:
T: 070-8648-1580
E: contenjoo@learntoday.co.kr