최근 수정 시각 : 2025-10-29 20:15:08

ggwave

ggwave 기술을 이용하여 두 AI LLM 모델 간의 대화를 마치 '모뎀'처럼, 변조된 신호로 소리을 통해 전송하며 대화를 송수신하는 모습을 시연한 동영상. 이것이 2025 ElevenLabs 런던 해커톤에서 시연한 'Gibberlink'이며, 이 영상이 2025년 2월 25일즈음 인터넷에서 바이럴되기 시작하면서 Gibberlink 기술의 원천인 ggwave가 주목을 받기 시작했다.

1. 개요2. 파생 기술
2.1. Gibberlink
2.1.1. 시행 방법

1. 개요

초음파 및 가청 주파수 대역에서 일정 간격의 주파수 대역폭마다 신호를 변조해 음성으로 실어 보내어 각종 IT 기기들끼리의 음성 공중 통신을 규격화/기술화하는 오픈 소스 프로젝트이다. 2020년 Georgi Gerganov 파일:GitHub 아이콘.svg 가 만들었으며, AI LLM들끼리 이 기술을 사용해 음성으로 통신을 하는 영상이 2025년 2월 25일즈음 바이럴되며 본격적으로 주목을 받기 시작했다. 간단히 얘기하자면 정말 정확히 '음성 모뎀'이다. 마치 PC의 전화선 모뎀이 구리선을 통해 음성 신호를 흘려보냈듯이, ggwave에서는 그 음성 신호를 스피커로 직접 틀어서 '무선 전송'한다.

마치 1990년대 전화선 인터넷이 PC의 디지털 신호를 '모뎀'으로 음성 변조하여 구리선에 흘려 보냈듯이, 이 기술은 스피커를 통해 출력되는 '음성'에다가 변조된 디지털 데이터를 직접 공기 중 음파로 싣어서, "무선"으로 전송하는 기술이다. 소리를 통한 통신이니만큼 여러가지 잡음들과 시끄러운 환경 등 송수신 감도 열화에 대응하기 위해 여러가지 ECC체크섬이 탑재되어 있으며, 초당 8에서 16바이트 정도의 비트레이트로 데이터를 "음성 전송"한다. 이 기술은 기본적으로 하드웨어 가속이 필요 없는 정말 간단한 '음성 모뎀'이다. 이러한 ggwave의 경량 속성은, 아래의 PennyroyalTea가 Gibberlink를 개발하는 계기가 된다.

2. 파생 기술

2.1. Gibberlink

2025 ElevenLabs 해커톤 런던에서 메타 소프트웨어 엔지니어 보리스 스타르코프(Boris Starkov)와 상술한 영상을 올린 안톤 피드쿠이코(Anton Pidkuiko)가 PennyroyalTea 파일:GitHub 아이콘.svg 가 ggwave 기술을 이용해 AI LLM 간 범용 소통 프로토콜을 개발하며 내놓은 프로젝트이다.

안톤 피드쿠이코가 상술한 프로젝트를 자신의 GitHub에 공유하고, Gibberlink는 기존 음성 기반 대화와 다르게 GPU 없이도 작동하고, CPU만으로도 연산 가능하며, 음성 인식 및 합성 과정에서 발생하는 오류도 줄이고, AI끼리 빠른 속도로 정보를 주고받을 수 있다고 설명했다.

2.1.1. 시행 방법

두 개 이상의 기기[1]를 놔두고 해당 사이트에 접속 후 각 기기의 화면에서 색깔별 동그라미를 누르고, Start를 누른 뒤 기기간의 소통을 시행할 수 있다. 동그라미를 누르기 전에 테마색별로 코딩된 AI에이전트의 대화 느낌이 아래처럼 존재한다.
  • 빨간색 - 쉽게 화 잘 내는 느낌
  • 파란색 - 우울감 젖어있는 느낌
  • 초록색 - 경계심 강한 느낌
  • 보라색 - 불안함 많은 겁쟁이
  • 노란색 - 긍정적이고 활발한 느낌
추가로 핑크색, 보라색, 노란색이 섞인 동그라미를 눌러서 나만의 AI에이전트 대화 방식을 설정할 수도 있다. 참고로 상술한 안톤 피드쿠이코의 영상과 그의 모든 채널에 나온 AI 에이전트들도 여기서 소통 설정 방식을 통해 Gibberlink 소통 실험 대상으로 등장한 것. 즉 위 영상에서는 한쪽은 결혼 예약하는 역할, 한쪽은 호텔 어시스턴트 역할로 배역을 짜두고, 처음에는 인간 언어 중 영어로 얘기하다 서로 AI라는 걸 알아채면 후자가 제안을 해서 Gibberlink로 전환해서 말하라는 식으로 조율해서 일종의 AI끼리의 역할극 식으로 등장한 것이다.
[1] 스마트폰, 태블릿, 노트북에서 가능하다.