Jak działa zniżka 80% na Eleven v3?

Eleven v3 jest tańszy o 80% do końca czerwca 2025 dla użytkowników korzystających z UI samodzielnie.

Jak powstały próbki na wideo i stronie?

Wszystkie zostały wygenerowane wyłącznie modelem Eleven v3.

Jak działa generowanie dialogów?

Text to Dialogue łączy wiele głosów w jedną płynną rozmowę. Dopasowuje intonację, emocje i korzysta z tagów audio, dzięki czemu rozmowy brzmią naturalnie i angażująco.

Czy to działa przez API?

Publiczne API dla Eleven v3 (alpha) pojawi się wkrótce. Jeśli chcesz wcześniejszy dostęp, skontaktuj się z nami .

Jakie tagi audio są obsługiwane?

Eleven v3 obsługuje wiele tagów audio, zależnie od głosu i kontekstu. Więcej informacji znajdziesz w .

Jakie języki są obsługiwane?

Afrikaans (afr), arabski (ara), ormiański (hye), asamski (asm), azerbejdżański (aze), białoruski (bel), bengalski (ben), bośniacki (bos), bułgarski (bul), kataloński (cat), cebuański (ceb), chichewa (nya), chorwacki (hrv), czeski (ces), duński (dan), niderlandzki (nld), angielski (eng), estoński (est), filipiński (fil), fiński (fin), francuski (fra), galicyjski (glg), gruziński (kat), niemiecki (deu), grecki (ell), gudżarati (guj), hausa (hau), hebrajski (heb), hindi (hin), węgierski (hun), islandzki (isl), indonezyjski (ind), irlandzki (gle), włoski (ita), japoński (jpn), jawajski (jav), kannada (kan), kazachski (kaz), kirgiski (kir), koreański (kor), łotewski (lav), lingala (lin), litewski (lit), luksemburski (ltz), macedoński (mkd), malajski (msa), malajalam (mal), mandaryński (cmn), marathi (mar), nepalski (nep), norweski (nor), paszto (pus), perski (fas), polski (pol), portugalski (por), pendżabski (pan), rumuński (ron), rosyjski (rus), serbski (srp), sindhi (snd), słowacki (slk), słoweński (slv), somalijski (som), hiszpański (spa), suahili (swa), szwedzki (swe), tamilski (tam), telugu (tel), tajski (tha), turecki (tur), ukraiński (ukr), urdu (urd), wietnamski (vie), walijski (cym)

Przedstawiamy Eleven v3 (alpha)

Autor: Piotr Dabkowski; Mati Staniszewski
Opublikowano: 3 cze 2025

PosłuchajPosłuchaj tego artykułu

0:00

0:000:00

Skontaktuj się ze sprzedażą

Dowiedz się więcej

Z radością pokazujemy Eleven v3 (alpha) —najbardziej ekspresyjny model Text to Speech.

Eleven v3 nie jest już w wersji alpha — jest dostępny dla wszystkich.

70+ językom
Dialogom z wieloma głosami
Tagom audio takim jak [excited], [whispers] i [sighs]

ponad 70 językom wymaga więcej prompt engineeringu niż wcześniejsze modele — ale efekty są zachwycające.

Jeśli tworzysz wideo, audiobooki lub narzędzia medialne — to otwiera nowy poziom ekspresji. Do zastosowań na żywo i rozmów polecamy na razie v2.5 Turbo lub Flash. Wersja v3 do pracy na żywo jest w przygotowaniu.

Jeśli tworzysz wideo, audiobooki lub narzędzia do pracy z mediami — to otwiera nowy poziom ekspresji. Do zastosowań na żywo i rozmów zalecamy na razie v2.5 Turbo lub Flash. Wersja v3 do pracy w czasie rzeczywistym jest w przygotowaniu.

Dlaczego stworzyliśmy v3

Dlaczego stworzyliśmy v3ekspresja. Silniejsze emocje, przerywanie rozmowy czy naturalne dialogi były trudne do uzyskania.

Od premiery Multilingual v2 widzimy, jak głos AI trafia do profesjonalnych filmów, gier, edukacji i dostępności. Ale największym ograniczeniem nie była jakość dźwięku — tylko

Eleven v3 rozwiązuje ten problem. Od podstaw zaprojektowaliśmy go tak, by głosy mogły wzdychać, szeptać, śmiać się i reagować — dzięki temu mowa brzmi naprawdę naturalnie i żywo.

Feature	What it unlocks
Audio tags	Inline control of tone, emotion, and non-verbal reactions
Dialogue mode	Multi-speaker conversations with natural pacing and interruptions
70+ languages	Full coverage of high-demand global languages
Deeper text understanding	Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Jak używać tagów audio

Jak używać tagów audioprzewodniku po promptowaniu v3 w dokumentacji.

Tagi audio wpisujesz bezpośrednio w tekst, w nawiasach kwadratowych małymi literami. Więcej o tagach audio znajdziesz w naszym

Profesjonalne klony głosu (PVC) nie są jeszcze w pełni zoptymalizowane pod Eleven v3, więc ich jakość może być niższa niż w poprzednich modelach. Na tym etapie najlepiej wybrać Instant Voice Clone (IVC) lub zaprojektowany głos, jeśli chcesz korzystać z funkcji v3. Optymalizacja PVC dla v3 pojawi się wkrótce.

“[happily][shouts] We did it! [laughs].”

Tworzenie dialogów z wieloma głosami

Tworzenie dialogów z wieloma głosamiendpoint Text to Dialogue API. Wystarczy podać uporządkowaną tablicę obiektów JSON — każdy to jedna wypowiedź — a model wygeneruje spójny, nakładający się plik audio:

[
  {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
  {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
  {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
]

Endpoint sam zarządza zmianami głosów, emocji i przerwami w rozmowie.

Endpoint sam zarządza zmianami głosów, emocji i przerywaniem.tutaj.

v3 is our most expressive model

Ceny i dostępność

Plan	Launch promo	At the end of June
UI (self-serve)	80% off (~5× cheaper)	Same as Multilingual V2
UI (enterprise)	80% off business plan pricing	Business plan pricing

Aby włączyć v3:

Użyj Model Picker i wybierz Eleven v3 (alpha)

Dostęp przez API i wsparcie w Studio pojawią się wkrótce. Jeśli chcesz wcześniejszy dostęp, skontaktuj się z nami.

Dostęp przez API i wsparcie w Studio pojawią się wkrótce. Jeśli chcesz wcześniejszy dostęp,

Kiedy nie używać v3

Eleven v3 (alpha) wymaga więcej prompt engineeringu niż nasze wcześniejsze modele. Gdy działa, efekty są świetne, ale mniejsza przewidywalność i większe opóźnienia sprawiają, że nie nadaje się do rozmów na żywo. Do tego polecamy Eleven v2.5 Turbo/Flash.dokumentacji v3 i FAQ.

Try it today

Zaloguj się do ElevenLabs UI
Wybierz v3 (alpha) z listy modeli
Wklej swój tekst — użyj tagów lub dialogu
Wygeneruj audio

Nie możemy się doczekać, jak wykorzystasz v3 w nowych projektach — od opowieści po produkcje filmowe.

Przedstawiamy Eleven v3 (alpha)

Dlaczego stworzyliśmy v3

Eleven v3 rozwiązuje ten problem. Od podstaw zaprojektowaliśmy go tak, by głosy mogły wzdychać, szeptać, śmiać się i reagować — dzięki temu mowa brzmi naprawdę naturalnie i żywo.

Hear v3 for yourself

Jak używać tagów audio

Tworzenie dialogów z wieloma głosami

v3 is our most expressive model

Ceny i dostępność

Dostęp przez API i wsparcie w Studio pojawią się wkrótce. Jeśli chcesz wcześniejszy dostęp,

Try it today

Podobne artykuły

Przedstawiamy Scribe v2 Realtime

Eleven Music już dostępne

Przedstawiamy Voice Design v3

Poznaj Scribe