VoiceBox od Meta – sztuczna inteligencja zamienia tekst na mowę
Mark Zuckerberg wyraźnie chce pokazać, że Meta idzie ramię w ramię, jeśli chodzi o rozwój technologiczny. Kilka dni temu koncern Zuckerberga zaprezentował VoiceBox, czyli narzędzie oparte o sztuczną inteligencję. VoiceBox pozwoli na zamianę tekstu na mowę.
Potencjał takich narzędzi AI jest ogromny, ponieważ zapewnia dostęp do profesjonalnie brzmiących głosów lektorskich. Co więcej, VoiceBox będzie także pomocny w tłumaczeniach. AI jest bowiem w stanie z łatwością czytać fragmenty w różnych językach – w tym także po polsku.
Profesjonalne audiobooki bez zatrudnienia lektora – czy VoiceBox to rewolucyjne narzędzie?
Rozwój technologiczny w przeciągu ostatnich miesięcy przyspiesza. Doskonałym tego dowodem są nowe narzędzia oparte o sztuczną inteligencję. Jednym z nich jest VoiceBox od Mety, czyli narzędzie do zamiany tekstu na mowę. Mówiąc prościej – VoiceBox przeczyta realistycznie brzmiącym głosem wszystko, co napiszemy.
Brzmi jak science fiction, ale demonstracyjne wideo udostępnione przez Metę na ich stronie naprawdę robi wrażenie. Wystarczy wpisać konkretny tekst, zaś VoiceBox przeczyta bo w wielu różnych wersjach i stylach. Dzięki temu użytkownik ma bardzo szerokie spektrum wyboru w kwestii tego, jak brzmieć ma przeczytany przez VoiceBox tekst.
Kolejną z opcji tego innowacyjnego narzędzia jest możliwość odszumiania nagrań audio. Sztuczna inteligencja wyłapuje niechciane i hałaśliwe dźwięki, zostawiając czysto brzmiące nagranie. Wszystko to możliwe jest dzięki oparciu narzędzia o model językowy LLaMA. VoiceBox będzie obsługiwał sześć języków: angielski, francuski, niemiecki, hiszpański, polski oraz portugalski. Narzędzie jest na ten moment w fazie testów, jednakże jego premiera powinna nastąpić już niedługo.
Polacy nie gęsi… swój ElevenLabs mają!
Choć cały technologiczny świat zachwycił się możliwościami VoiceBox, to okazuje się, że podobne narzędzie funkcjonuje już w sieci od około roku i odpowiedzialny jest za niego… polski zespół deweloperów. ElevenLabs jest oprogramowaniem pozwalającym na zamianę tekstu na mowę za pomocą sztucznej inteligencji i deep learningu.
ElevenLabs jest obecnie uważane za najlepsze narzędzie do tworzenia realistycznie brzmiących plików audio. Sukces polskiego start-upu rozpoczął jednak dyskusję na temat prawdziwości nagrań audio i tego, jak bardzo niebezpieczne mogą być fake newsy oparte o tak realistyczny dźwięk. Warto dodać jednak, iż ElevenLabs otrzymało dofinansowanie w wysokości 19 milionów dolarów.
Co więcej, polski start-up zaprezentował AI Speech Classifier, czyli narzędzie do uwierzytelniania. Za jego pomocą użytkownicy będą mogli sprawdzić, czy dane nagranie zostało wygenerowane za pomocą ElevenLabs.
Bitcoina i inne kryptowaluty kupisz w prosty i bezpieczny sposób na giełdzie zondacrypto.
Zawodowy copywriter oraz social media manager. Od 5 lat publikuje treści w tematyce m.in. nowoczesnych technologii. W Bitcoin.pl zajmuje się nowościami z rynku, artykułami odnośnie kryptowalut oraz sztucznej inteligencji.
Zawodowy copywriter oraz social media manager. Od 5 lat publikuje treści w tematyce m.in. nowoczesnych technologii. W Bitcoin.pl zajmuje się nowościami z rynku, artykułami odnośnie kryptowalut oraz sztucznej inteligencji.
Newsletter Bitcoin.pl
Więcej niż bitcoin i kryptowaluty. Najważniejsze newsy i insiderskie informacje prosto na Twój email.
Dbamy o ochronę Twoich danych. Przeczytaj naszą Politykę Prywatności