ElevenLabs — Ses AI

Ne yapar?

ElevenLabs, AI ses üretimi ve ses altyapısı üzerine uzmanlaşmış bir platformdur. Text-to-speech, speech-to-text, ses klonlama, ses tasarımı, ses değiştirici, ses izolasyonu, dublaj, ses efektleri, müzik üretimi ve sohbet eden voice agent'lar gibi ses odaklı ürünleri tek ekosistemde toplar.

Mayıs 2026 itibarıyla ElevenLabs'in ana gücü, gerçekçi ve duygulu ses üretimi ile düşük gecikmeli voice agent altyapısıdır. Eleven v3 en etkileyici çok dilli TTS modeli olarak konumlanırken, Eleven Flash v2.5 gerçek zamanlı uygulamalar ve agent'lar için ultra düşük gecikme sağlar. Transkripsiyon tarafında Scribe v2 ve Scribe v2 Realtime, 90+ dilde speech-to-text sunar.

ElevenLabs, ChatGPT veya Claude gibi genel amaçlı bir sohbet botu değildir. Daha çok geliştiriciler ve creator'lar için ses katmanıdır: uygulamalara konuşma eklemek, AI agent'ları seslendirmek, podcast/video voiceover üretmek, dublaj yapmak, ses klonlamak, müzik ve ses efekti üretmek için kullanılır.

Modeller

Eleven v3 — 70+ dilde en etkileyici ve doğal konuşma üretimi için kullanılır. Duygu, tonlama, ritim ve karakterli konuşma gerektiren creator, reklam, oyun, podcast ve video voiceover işlerinde öne çıkar. Inline audio tag'leri (örn. [laughs], [whispering]) destekler.

Eleven Flash v2.5 — Düşük gecikmeli TTS modelidir, yaklaşık 75ms'de ilk ses üretir. Real-time voice agent, canlı sohbet, müşteri destek botu ve streaming uygulamalarında hızlı tepki için tercih edilir.

Scribe v2 — 90+ dilde transkripsiyon, speaker diarization, word-level timestamp, dynamic audio tagging, entity detection ve keyterm prompting özellikleri sunar.

Scribe v2 Realtime — Ocak 2026'da çıktı. Yaklaşık 150ms gecikmeyle canlı konuşma tanıma sağlar. Voice agent'lar, toplantı transkripsiyonu ve gerçek zamanlı altyazı kullanım alanları için uygundur.

Eleven Music — Doğal dil prompt'larıyla müzik üretimi sağlar. Oyun, podcast, reklam ve sosyal medya içerikleri için müzik veya instrumental üretiminde kullanılabilir.

Fiyatlandırma

Free ($0/ay) — 10,000 kredi, ticari kullanım yok
Starter ($6/ay) — 30,000 kredi, ticari kullanım hakkı, anlık ses klonlama
Creator ($22/ay) — 100,000 kredi, profesyonel ses klonlama (PVC)
Pro ($99/ay) — 500,000 kredi, yüksek hacimli API kullanımı
Scale ($330/ay) — 2,000,000 kredi, scale seviye workflow'lar
Business ($1320/ay) — 11,000,000 kredi, büyük ekip kullanımı
Enterprise — özel şartlar, SSO, DPA/SLA, öncelikli destek, HIPAA BAA

Kredi sistemi karakter bazlı: Multilingual v2 modellerinde 1 karakter = 1 kredi, Flash/Turbo modellerinde 0.5 kredi/karakter. Kullanılmayan krediler 2 ay'a kadar devredilebilir. Creator ve üstü planlarda usage-based overage faturalandırması açılabilir.

Yetenekler

70+ dilde gerçekçi text-to-speech
90+ dilde speech-to-text
Ses klonlama ve ses tasarımı
Ses değiştirici ve ses izolasyonu
Dublaj, ses efektleri ve müzik üretimi
Sohbet eden AI voice agent'lar
Telefon, web ve mobil deployment
REST API, Python SDK ve TypeScript SDK
Streaming ve düşük gecikmeli konuşma pipeline'ları
10,000+ seslik Voice Library

Güçlü yanları

AI ses üretimi alanındaki en güçlü ve bilinen markalardan biri
Ses üretimi, transkripsiyon, dublaj, agent, müzik ve ses efekti tarafını tek platformda topluyor
Eleven Flash v2.5 ve Speech Engine ile gerçek zamanlı voice agent'lar için güçlü
Scribe v2 ve Scribe v2 Realtime ile çok dilli transkripsiyonda güçlü
Creator'lar için no-code araçlar, geliştiriciler için API/SDK desteği var
10,000+ seslik kütüphane ve ses klonlama seçenekleri geniş kullanım alanı sağlar

Zayıf yanları

Genel amaçlı bir sohbet botu değildir; ChatGPT/Claude yerine değil, ses katmanı olarak düşünülmeli
TTS fiyatlandırması karakter bazlı olduğu için uzun form içerikte maliyet büyüyebilir
Ses klonlama kötüye kullanım riski taşır; izin ve hak yönetimi dikkat ister
Ticari kullanım ve profesyonel özellikler için ücretli plan gerekir
Görsel/video üretimi ana uzmanlık alanı değildir
GPT Store, Claude Skills veya MCP directory gibi olgun bir üçüncü taraf marketplace'i yoktur

Ekosistem

ElevenLabs ekosistemi dört ana katmandan oluşur: ElevenCreative, ElevenAgents, ElevenAPI ve Voice Library.

ElevenCreative no-code web arayüzüyle konuşma üretimi, dublaj, müzik, ses efektleri, ses klonlama, ses değiştirici ve yaratıcı ses üretimi sağlar. Creator'lar, video üreticileri, reklamcılar, podcast yayıncıları ve oyun geliştiricileri için uygundur.

ElevenAgents sesli AI agent geliştirme platformudur. Kullanıcılar doğal konuşmayla görev tamamlayan agent'lar oluşturabilir, workflow tasarlayabilir, sistem prompt'ları yazabilir, LLM seçebilir, telefon/web/mobil kanallara deploy edebilir ve performansı analiz edebilir.

ElevenAPI TTS, STT, agent, dublaj, müzik, ses efektleri, ses değiştirici ve ses izolasyonu özelliklerini REST API, Python SDK ve TypeScript SDK üzerinden geliştiricilere sunar.

Voice Library 10,000+ insan benzeri sesi içerir. Kullanıcılar hazır sesleri kullanabilir, kendi seslerini klonlayabilir veya metin açıklamasından yeni ses tasarlayabilir.

ElevenLabs, Claude Skills veya MCP gibi geniş bir agent marketplace'e sahip değildir; ancak sesli agent, konuşma üretimi ve real-time audio pipeline tarafında birçok AI uygulamasının altyapı katmanı olarak çalışır.