
Vi presenterar Scribe v2
Idag presenterar vi Scribe v2: den mest exakta transkriptionsmodellen som någonsin släppts, med stöd för mer än 90 språk.
Scribe v2 är byggd för batchtranskription, undertextning och textning i stor skala. Den förbättrar stabiliteten och noggrannheten hos Scribe v1, med bättre hantering av långformsljud, pauser, tonförändringar och långa tystnader.

Medan Scribe v2 Realtime är optimerad för ultra låg latens och agentanvändning, är Scribe v2 optimerad för långa och komplexa inspelningar, och bibehåller noggrannhet över olika talare, accenter och leveransstilar. Resultatet är konsekvent tillförlitliga transkriptioner över ett brett spektrum av verkliga ljudförhållanden.
Scribe v2 uppnår den lägsta felprocenten för ord som registrerats på industristandardiserade riktmärken.

Nyckeltermspromptning för kontextmedveten transkription
Nyckeltermspromptning går bortom standardanpassat ordförråd genom att använda transkriptets kontext. Välj upp till 100 ord eller fraser, och Scribe v2 kommer noggrant att avgöra när dessa termer ska transkriberas. Detta gör den väl lämpad för tekniska områden, varumärken och branschspecifikt språk.

Inbyggd entitetsdetektion med exakta tidsstämplar
Scribe v2 inkluderar inbyggd entitetsdetektion för strukturerad ljudanalys.
Du kan välja upp till 56 kategorier inom personligt identifierbar information, hälsodata eller betalningsuppgifter. Scribe v2 kommer automatiskt att upptäcka dessa instanser och deras exakta tidsstämplar i ditt transkript, vilket gör det enklare att granska, redigera eller bearbeta känslig information i stor skala.
Läs mer i API-dokumentationen: https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection
Automatisk flerspråkig transkription
Scribe v2 stöder smarta flerspråkiga arbetsflöden direkt.
Du kan skicka ljud som innehåller flera språk i en enda fil. Modellen upptäcker automatiskt varje språk och transkriberar det korrekt utan manuell segmentering eller konfiguration.
Ytterligare funktioner för produktionsarbetsflöden
Scribe v2 inkluderar en uppsättning funktioner designade för företags- och utvecklaranvändning:
- Smart talardiari för tydlig, intuitiv talarmärkning
- Exakta ordnivåtidsstämplar för korrekt undertextjustering och interaktiva upplevelser
- Dynamisk ljudtaggning som upptäcker icke-talhändelser som skratt eller fotsteg
- Företagsberedskap med SOC 2, ISO 27001, PCI DSS L1, HIPAA och GDPR-efterlevnad, EU och Indien datalagring, och stöd för noll retention-läge
Scribe v2, nu i ElevenLabs Studio
Scribe v2 används nu i ElevenLabs Studio för mer exakta undertexter, textningar och transkriptioner, och stödjer team som hanterar stora bibliotek av ljud och video inom marknadsföring, media, forskning, utbildning och efterlevnad.

Prova nu: https://elevenlabs.io/app/studio
Bygg med API:et
Med Scribe v2 kan utvecklare och företag automatisera komplexa ljudflöden, förbättra noggrannheten i globala innehållsarbetsflöden och skala säkert med fullständig efterlevnad och datalagringskontroller.

Scribe v2 är tillgänglig idag via vårt API och Creative-plattform.
Prova nu: https://elevenlabs.io/app/speech-to-text
Läs dokumentationen: https://elevenlabs.io/docs/capabilities/speech-to-text
Registrera dig här: https://elevenlabs.io/speech-to-text
Utforska artiklar av ElevenLabs-teamet


Introducing Experiments in ElevenAgents
The most data-driven way to improve real-world agent performance.

