
Scribe v2 Realtime już dostępny w ElevenLabs Agents
Nasz model zamiany mowy na tekst z ultraniskim opóźnieniem, stworzony z myślą o agentach, jest już dostępny w Agents Platform.
Ultra-niskie opóźnienie
This week, we introduced Scribe v2 Realtime - our ultra-low latency streaming Speech to Text model, optimized for agentic use cases that depend on speed, accuracy, and conversational precision.
Scribe v2 Realtime transcribes speech in under 150ms with state-of-the-art accuracy, enabling agents to respond as naturally as humans do in conversation.
Stworzony do prawdziwych rozmów
Większość systemów zamiany mowy na tekst działa dobrze w idealnych warunkach, ale ma problem w rzeczywistości — w hałasie, przy różnych akcentach czy przy rozpoznawaniu imion, maili i numerów.
Scribe v2 Realtime został przeszkolony właśnie na takie wyzwania.
W naszych testach na setkach trudnych rozmów po angielsku — z kiepską jakością dźwięku, różnymi akcentami i wtrąceniami — Scribe v2 Realtime lepiej rozpoznawał intencje użytkownika niż jakikolwiek inny model ASR w czasie rzeczywistym.
Poniżej znajdziesz kilka przykładów z życia, na których sprawdzaliśmy dokładność transkrypcji Scribe v2 Realtime w różnych warunkach.
Najlepsza dokładność w wielu językach
Jako globalna firma z wieloma agentami mówiącymi po hiszpańsku, portugalsku, hindi i w innych językach, zadbaliśmy, by Scribe v2 Realtime działał równie dobrze w każdym regionie.
W teście FLEURS, który mierzy dokładność w 30 językach, Scribe v2 Realtime osiągnął najniższy współczynnik błędów (WER) spośród wszystkich modeli ASR z niskim opóźnieniem.
Dzięki temu firmy mogą uruchamiać wielojęzycznych agentów, którzy odpowiadają natychmiast i precyzyjnie — bez kompromisów.
Już dostępny w ElevenLabs Agents
Scribe v2 Realtime jest w pełni zintegrowany z ElevenLabs Agents i możesz go włączyć w sekcji Zaawansowane.

Przeglądaj artykuły zespołu ElevenLabs


Introducing Experiments in ElevenAgents
The most data-driven way to improve real-world agent performance.


