Hur fungerar Eleven v3:s 80 % rabatt?

Eleven v3 är 80 % billigare fram till slutet av juni 2025 för självbetjäningsanvändare som använder den via UI.

Hur skapades exemplen i videon och på webbplatsen?

De skapades enbart med Eleven v3-modellen.

Hur fungerar dialoggenerering?

Text to Dialogue väver ihop flera röster för att skapa ett sömlöst samtal mellan dem. Genom att matcha prosodi, känsloregister och använda ljudtaggar tar Text to Dialogue ett stort steg framåt för engagerande konversationer.

Finns detta tillgängligt via API?

Publikt API för Eleven v3 (alpha) kommer snart. För tidig åtkomst, kontakta säljteamet .

Vilka ljudtaggar stöds?

Eleven v3 stöder många olika ljudtaggar och vilka som fungerar beror delvis på röst och sammanhang. Läs mer i .

Afrikaans (afr), arabiska (ara), armeniska (hye), assamesiska (asm), azerbajdzjanska (aze), vitryska (bel), bengali (ben), bosniska (bos), bulgariska (bul), katalanska (cat), cebuano (ceb), chichewa (nya), kroatiska (hrv), tjeckiska (ces), danska (dan), nederländska (nld), engelska (eng), estniska (est), filipino (fil), finska (fin), franska (fra), galiciska (glg), georgiska (kat), tyska (deu), grekiska (ell), gujarati (guj), hausa (hau), hebreiska (heb), hindi (hin), ungerska (hun), isländska (isl), indonesiska (ind), iriska (gle), italienska (ita), japanska (jpn), javanesiska (jav), kannada (kan), kazakiska (kaz), kirgiziska (kir), koreanska (kor), lettiska (lav), lingala (lin), litauiska (lit), luxemburgiska (ltz), makedonska (mkd), malajiska (msa), malayalam (mal), mandarin (cmn), marathi (mar), nepali (nep), norska (nor), pashto (pus), persiska (fas), polska (pol), portugisiska (por), punjabi (pan), rumänska (ron), ryska (rus), serbiska (srp), sindhi (snd), slovakiska (slk), slovenska (slv), somaliska (som), spanska (spa), swahili (swa), svenska (swe), tamil (tam), telugu (tel), thailändska (tha), turkiska (tur), ukrainska (ukr), urdu (urd), vietnamesiska (vie), walesiska (cym)

Vi presenterar Eleven v3 (alpha)

Skriven av: Piotr Dabkowski; Mati Staniszewski
Publicerad: 3 juni 2025

LyssnaLyssna på den här artikeln

0:00

0:000:00

Kontakta säljteamet

Läs mer

Vi är glada att presentera Eleven v3 (alpha) — det mest uttrycksfulla Text to Speech-modellen.

Eleven v3 är inte längre i alfa och är nu tillgänglig för alla.

70+ språk
Flera röster i dialog
Ljudtaggar som [excited], [whispers] och [sighs]

70+ språk kräver mer prompt engineering än tidigare modeller — men resultaten är fantastiska.

Om du jobbar med videor, ljudböcker eller medieverktyg öppnar det här upp en helt ny nivå av uttrycksfullhet. För realtids- och konversationsanvändning rekommenderar vi att du fortsätter med v2.5 Turbo eller Flash tills vidare. En realtidsversion av v3 är på gång.

Om du jobbar med videor, ljudböcker eller medieverktyg — då får du en helt ny nivå av uttryck. För realtids- och konversationsanvändning rekommenderar vi att du fortsätter med v2.5 Turbo eller Flash tills vidare. En realtidsversion av v3 är på gång.

Varför vi byggde v3

Varför vi byggde v3uttrycksfullheten. Mer överdrivna känslor, avbrott i samtal och trovärdiga dialoger har varit svåra att få till.

Sedan vi lanserade Multilingual v2 har AI-röster börjat användas inom film, spelutveckling, utbildning och tillgänglighet. Men den största begränsningen har inte varit ljudkvaliteten — utan

Eleven v3 löser det här. Modellen är byggd från grunden för att leverera röster som suckar, viskar, skrattar och reagerar — och skapar tal som känns levande och responsivt.

Feature	What it unlocks
Audio tags	Inline control of tone, emotion, and non-verbal reactions
Dialogue mode	Multi-speaker conversations with natural pacing and interruptions
70+ languages	Full coverage of high-demand global languages
Deeper text understanding	Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Så använder du ljudtaggar

Så använder du ljudtaggarprompting-guide för v3 i dokumentationen.

Ljudtaggar placeras direkt i ditt manus och skrivs med små bokstäver inom hakparenteser. Du kan läsa mer om ljudtaggar i vår

Professional Voice Clones (PVC) är ännu inte helt optimerade för Eleven v3, vilket kan ge sämre kloningskvalitet jämfört med tidigare modeller. Under den här forskningsperioden är det bäst att använda en Instant Voice Clone (IVC) eller en designad röst om du vill använda v3-funktioner. Optimering för PVC i v3 kommer snart.

“[happily][shouts] We did it! [laughs].”

Skapa dialog med flera röster

Skapa dialog med flera rösterText to Dialogue API-endpoint. Skicka in en strukturerad array av JSON-objekt — där varje objekt är ett talarbyte — så genererar modellen en sammanhängande, överlappande ljudfil:

[
  {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
  {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
  {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
]

Endpointen hanterar automatiskt byten mellan talare, känsloskiften och avbrott.

Endpointen hanterar automatiskt byten mellan röster, känsloskiften och avbrott.här.

v3 is our most expressive model

Pris och tillgänglighet

Plan	Launch promo	At the end of June
UI (self-serve)	80% off (~5× cheaper)	Same as Multilingual V2
UI (enterprise)	80% off business plan pricing	Business plan pricing

Så aktiverar du v3:

Använd Model Picker och välj Eleven v3 (alpha)

API-åtkomst och stöd i Studio kommer snart. För tidig åtkomst, kontakta säljteamet.

API-stöd och Studio-stöd kommer snart. Vill du testa tidigt,

När du inte ska använda v3

Eleven v3 (alpha) kräver mer prompt engineering än våra tidigare modeller. När det fungerar är resultatet fantastiskt, men tillförlitligheten och högre fördröjning gör att den inte passar för realtids- och konversationsanvändning. För det rekommenderar vi Eleven v2.5 Turbo/Flash.v3-dokumentationen och vanliga frågor.

Try it today

Logga in på ElevenLabs UI
Välj v3 (alpha) i modellmenyn
Klistra in ditt manus — använd taggar eller dialog
Generera ljud

Vi ser fram emot att se hur du använder v3 i nya sammanhang — från berättande till filmproduktion.

Vi presenterar Eleven v3 (alpha)

Varför vi byggde v3

Eleven v3 löser det här. Modellen är byggd från grunden för att leverera röster som suckar, viskar, skrattar och reagerar — och skapar tal som känns levande och responsivt.

Hear v3 for yourself

Så använder du ljudtaggar

Skapa dialog med flera röster

v3 is our most expressive model

Pris och tillgänglighet

API-stöd och Studio-stöd kommer snart. Vill du testa tidigt,

Try it today

Liknande artiklar

Vi presenterar Scribe v2 Realtime

Eleven Music är här

Introducerar Voice Design v3

Möt Scribe