# 모시(Moshi): GPT-4에 도전장을 내민 오픈소스 음성 AI

![Image](https://upload.cafenono.com/image/slashpagePost/20240706/145650_cNI53CkBWGjkZBWGnD?q=75&s=1280x180&t=outside&f=webp)

• 프랑스 파리 연구소 개발
• 음성 입력-출력 지원 오픈소스 모델
• 70가지 감정/스타일 표현
• 8인 팀, 6개월 만에 구현
• 웹 데모로 직접 체험 가능
• 향후 완전 오픈소스화 예정

모시(Moshi)는 GPT-4의 음성 기능에 대항할 수 있는 첫 오픈소스 모델로 주목받고 있다. 프랑스 파리의 연구소에서 개발한 이 AI는 음성 입력과 출력을 모두 지원하며, 놀라운 속도로 응답한다.

주요 특징:

1. 다양한 표현: 70가지 감정과 스타일 구현 가능

2. 빠른 개발: 8명의 연구원이 6개월 만에 프로토타입 완성

3. 낮은 지연시간: 실시간 대화에 적합한 빠른 응답 속도

4. 확장성: 8비트 및 4비트 양자화로 다양한 환경 지원

모시 체험하기:
모시는 현재 [https://kyutai.org/](https://kyutai.org/) 에서 웹 데모로 체험할 수 있다. 주요 특징은 다음과 같다:

- 실험적 대화형 AI로, 응답의 정확성을 보장하지 않음

- 대화 시간은 5분으로 제한

- 동시에 생각하고 말하는 기능 구현

- 지속적인 음성 입력과 출력으로 자연스러운 대화 흐름 제공

- 해적 역할극, 라자냐 요리법, 최근 본 영화 등 다양한 주제로 대화 가능

- 크롬 브라우저에서 최적화된 성능 제공

- 위치에 따라 EU 데모 서버가 더 나은 응답 속도를 제공할 수 있음

개발팀은 곧 기술 보고서와 함께 7B 파라미터 모델, 오디오 코덱, 최적화된 스택을 포함한 전체 코드베이스를 공개할 예정이다.

이 모델의 등장은 AI 음성 기술의 민주화를 예고한다. 향후 로컬 설치가 가능해지면, 개인용 컴퓨터에서도 고성능 AI 음성 비서를 구현할 수 있을 것으로 전망된다.

모시의 오픈소스 전략은 Mistral AI의 성공 사례를 따르고 있다. 이는 AI 기술 발전의 가속화와 함께, 대기업 독점에서 벗어나 더 넓은 개발자 커뮤니티의 참여를 유도할 것으로 기대된다. 모시의 발전은 AI 음성 기술 분야에 새로운 혁신의 바람을 일으킬 것으로 보인다.

For the site tree, see the [root Markdown](https://blog.learntoday.co.kr/.md).