za
Android od Meta pozwalający na zamianę tekstu na mowę.

VoiceBox od Meta – sztuczna inteligencja zamienia tekst na mowę

Zondacrypto gielda kryptowalut 2650

Mark Zuckerberg wyraźnie chce pokazać, że Meta idzie ramię w ramię, jeśli chodzi o rozwój technologiczny. Kilka dni temu koncern Zuckerberga zaprezentował VoiceBox, czyli narzędzie oparte o sztuczną inteligencję. VoiceBox pozwoli na zamianę tekstu na mowę.

Potencjał takich narzędzi AI jest ogromny, ponieważ zapewnia dostęp do profesjonalnie brzmiących głosów lektorskich. Co więcej, VoiceBox będzie także pomocny w tłumaczeniach. AI jest bowiem w stanie z łatwością czytać fragmenty w różnych językach – w tym także po polsku.

Profesjonalne audiobooki bez zatrudnienia lektora – czy VoiceBox to rewolucyjne narzędzie?

Rozwój technologiczny w przeciągu ostatnich miesięcy przyspiesza. Doskonałym tego dowodem są nowe narzędzia oparte o sztuczną inteligencję. Jednym z nich jest VoiceBox od Mety, czyli narzędzie do zamiany tekstu na mowę. Mówiąc prościej – VoiceBox przeczyta realistycznie brzmiącym głosem wszystko, co napiszemy.

Brzmi jak science fiction, ale demonstracyjne wideo udostępnione przez Metę na ich stronie naprawdę robi wrażenie. Wystarczy wpisać konkretny tekst, zaś VoiceBox przeczyta bo w wielu różnych wersjach i stylach. Dzięki temu użytkownik ma bardzo szerokie spektrum wyboru w kwestii tego, jak brzmieć ma przeczytany przez VoiceBox tekst.

Kolejną z opcji tego innowacyjnego narzędzia jest możliwość odszumiania nagrań audio. Sztuczna inteligencja wyłapuje niechciane i hałaśliwe dźwięki, zostawiając czysto brzmiące nagranie. Wszystko to możliwe jest dzięki oparciu narzędzia o model językowy LLaMA. VoiceBox będzie obsługiwał sześć języków: angielski, francuski, niemiecki, hiszpański, polski oraz portugalski. Narzędzie jest na ten moment w fazie testów, jednakże jego premiera powinna nastąpić już niedługo.

Android-tłumacz.

Polacy nie gęsi… swój ElevenLabs mają!

Choć cały technologiczny świat zachwycił się możliwościami VoiceBox, to okazuje się, że podobne narzędzie funkcjonuje już w sieci od około roku i odpowiedzialny jest za niego… polski zespół deweloperów. ElevenLabs jest oprogramowaniem pozwalającym na zamianę tekstu na mowę za pomocą sztucznej inteligencji i deep learningu.

ElevenLabs jest obecnie uważane za najlepsze narzędzie do tworzenia realistycznie brzmiących plików audio. Sukces polskiego start-upu rozpoczął jednak dyskusję na temat prawdziwości nagrań audio i tego, jak bardzo niebezpieczne mogą być fake newsy oparte o tak realistyczny dźwięk. Warto dodać jednak, iż ElevenLabs otrzymało dofinansowanie w wysokości 19 milionów dolarów.

Co więcej, polski start-up zaprezentował AI Speech Classifier, czyli narzędzie do uwierzytelniania. Za jego pomocą użytkownicy będą mogli sprawdzić, czy dane nagranie zostało wygenerowane za pomocą ElevenLabs.

Bitcoina i inne kryptowaluty kupisz w prosty i bezpieczny sposób na giełdzie zondacrypto.

Tagi
Autor

Zawodowy copywriter oraz social media manager. Od 5 lat publikuje treści w tematyce m.in. nowoczesnych technologii. W Bitcoin.pl zajmuje się nowościami z rynku, artykułami odnośnie kryptowalut oraz sztucznej inteligencji.

Newsletter Bitcoin.pl

Więcej niż bitcoin i kryptowaluty. Najważniejsze newsy i insiderskie informacje prosto na Twój email.

Dbamy o ochronę Twoich danych. Przeczytaj naszą Politykę Prywatności

Bitcoin logo
BitcoinBTC
64 323,38 USD0,92%
Ethereum logo
EthereumETH
3160,02 USD0,83%
Tether logo
TetherUSDT
1,00 USD0,04%
Binance Coin logo
Binance CoinBNB
593,37 USD1,25%
Solana logo
SolanaSOL
154,36 USD5,63%
USDC logo
USDCUSDC
1,00 USD0,06%
XRP logo
XRPXRP
0,54 USD1,53%
Lido Staked Ether logo
Lido Staked EtherSTETH
3159,29 USD0,83%
Dogecoin logo
DogecoinDOGE
0,16 USD1,30%
Toncoin logo
ToncoinTON
6,02 USD4,65%