ChatGPT’yi kullanıma sunmasıyla dünya genelinde bir anda popüler olan OpenAI, yeni teknolojileri geliştirmeye devam ediyor.
Şirket, 15 saniyelik kayıttan ses klonlayabilen yeni “Voice Engine” teknolojisinin tanıtttı.
Açıklamada, “Voice Engine”in yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak konuşmacının sesine çok benzeyen bir konuşma üretebildiği bilgisi paylaşıldı.
Söz konusu teknolojinin 2022’de geliştirildiği belirtilen açıklamada, “kötüye kullanım potansiyeli” nedeniyle daha geniş bir sürüm için temkinli ve bilinçli yaklaşım benimsendiği ifade edildi.
Bazı güvenlik önlemleri alındı
Güvenlik endişelerine ilişkin, Voice Engine’in test aşamasındaki kullanıcı partnerlerine, kişi veya kuruluşların kimliğini kullanmanın yasaklandığı, orijinal konuşmacının rızasının gerektiği ve seslerin yapay zeka tarafından üretildiğinin izleyicilere açıkça bildirilmesinin zorunlu kılındığı açıklandı.
Çeviri de yapabilecek
Açıklamada ayrıca, Voice Engine’in orijinal konuşmacının sesini koruyarak çeviri yapabileceği bilgisi de paylaşıldı.
Video ve podcast gibi içerik üreticilerinin bu özellikten faydalanarak “kendi sesleriyle” dünyaya ulaşabileceği, çevrilen seste orijinal konuşmacının “aksanını” da koruyabileceği vurgulandı.