Branża AI w 2024 roku - podsumowanie. Działo się, oj działo!
Jeremiasz KrokRedaktor Bitcoin.pl

Czy 12 miesięcy to dużo? W branży AI to jak 5 lat. Giganci technologiczni prowadzą wyścig, który napędza innowacje i stymuluje rozwój całego sektora. Rok 2024 przyniósł wiele innowacji, zmian, nowych narzędzi oraz obiecujących zapowiedzi. Jak wyglądał rozwój branży sztucznej inteligencji w 2024 roku?
Więcej, szybciej, lepiej - perpetuum mobile branży AI
Wydarzeń z wiązanych z AI w 2024 roku było tak dużo, że postanowiłem podzielić ten tekst na 4 kwartały. W każdym z tych 3-miesięcznych okresów działo się coś istotnego, co wyraźnie pokazuje dynamikę tego sektora. Tak szybki postęp napędza rywalizacja dwóch gigantów, czyli OpenAI oraz Google. Tak, twórcy legendarnej wyszukiwarki nadrobili zaległości i dogonili OpenAI w rozwoju własnych rozwiązań AI.
Co oprócz tego wyścigu? Przede wszystkim wysyp narzędzi do generowania grafik oraz treści wideo. Ale jakby powiedział Pan Bogusław Wołoszański „nie uprzedzajmy faktów”.
1. Styczeń-marzec - rozwój ChatGPT, Sora i coraz większa konkurencja
Mogłoby się wydawać, że pierwsze miesiące 2024 roku w branży sztucznej inteligencji przeminęły raczej spokojnie - przecież to 2023 był prawdziwym rollercoasterem. Nic z tych rzeczy, ponieważ już w styczniu OpenAI udostępnia w darmowej wersji ChatGPT 4-Turbo, czyli ulepszenie swojego flagowego modelu językowego. Jak pokażą następne miesiące - model 4Turbo był jedynie rozgrzewką. Warto dodać, że w styczniu zadebiutował także GPTs Store, czyli sklep z personalizowanymi modelami czatów.
Liderzy branży AI nie poprzestali na styczniowych ogłoszeniach, ponieważ w lutym (dokładnie 15 lutego) Sam Altman ujawnia Sorę, czyli model sztucznej inteligencji zdolny do generowania realistycznie wyglądających klipów wideo. Po prezentacji Sory internet oszalał - ogłoszono rewolucję, choć Sam Altman i jego team nie potwierdził, kiedy ukaże się generator Sora (spoiler alert - dużo, dużo później).
Choć Sora zrobiła sporo zamieszania, tak odległa data premiery (w zasadzie niezapowiedziana) sprawiła, że wszelakiej maści konkurenci postanowili działać.
Haiper to narzędzie stworzone przez dwóch byłych pracowników Google DeepMind, które pojawiło się w marcu 2024. Na początku swojego istnienia było w stanie tworzyć 2-sekundowe animacje, zarówno text-to-video, jak i image-to-video. Powoli zaczął się także zarysowywać trend roku 2024, czyli generatory wideo. Warto dodać, że w marcu Parlament Europejski przyjął AI Act, czyli 144-stronicowe rozporządzenie w sprawie sztucznej inteligencji.
OpenAI@OpenAIIntroducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy
2. Kwiecień-czerwiec - giganci prężą muskuły na konferencjach
Drugi kwartał 2024 to prężenie muskułów gigantów AI i masa zapowiedzi. Kwiecień minął pod znakiem Xów, wpisów na social mediach uchylających rąbka tajemnicy przed zbliżającymi się wydarzeniami. Ale nie tylko, ponieważ pod koniec kwietnia Apple zaprezentował OpenELM, otwartoźródłowy framework do trenowania i wdrażania modeli AI na urządzeniach mobilnych. Narzędzie to ma na celu zwiększenie dostępności zaawansowanych funkcji AI dla deweloperów aplikacji.
Maj okazał się miesiącem konferencji. OpenAI Spring Update przedstawił nowy model GPT-4o („o” od „omni”). Jest on multimodalny - obsługuje dźwięk i obraz, dlatego można zaryzykować stwierdzenie, że ChatGPT dostał oczy i uszy. Warto dodać, że w trakcie konferencji zaprezentowano nowy zaawansowany tryb głosowy, który odpowiadał prezenterom z OpenAI bez opóźnienia. Sam głos ChatuGPT bardzo przypominał w trakcie prezentacji brzmienie głosu aktorki Scarlett Johanson, o czym zrobiło się głośno kilka tygodni później.
Maj okazał się miesiącem konferencji. OpenAI Spring Update przedstawił nowy model GPT-4o („o” od „omni”). Jest on multimodalny - obsługuje dźwięk i obraz, dlatego można zaryzykować stwierdzenie, że ChatGPT dostał oczy i uszy. Warto dodać, że w trakcie konferencji zaprezentowano nowy zaawansowany tryb głosowy, który odpowiadał prezenterom z OpenAI bez opóźnienia. Sam głos ChatuGPT bardzo przypominał w trakcie prezentacji brzmienie głosu aktorki Scarlett Johanson, o czym zrobiło się głośno kilka tygodni później.
Jeśli chodzi o pozostałe modele, to OpenAI rozszerzyło wsparcie dla większej liczby języków, poprawiając jakość tłumaczeń i generowania tekstu. Zaktualizowano również API, co umożliwiło bardziej elastyczne opcje integracji i lepszą wydajność przy pracy z dużymi zbiorami danych. Zapowiedzianej w lutym Sory nadal nie było.
Google i Apple
Google także zaprezentowało swoje nowości w maju podczas konferencji I/O 2024. Co ciekawe konferencja odbyła się dzień po tej od OpenAI.
Gigant pokazał szereg innowacji, skupiając się jednak na rozwoju rozwiązań opartych na sztucznej inteligencji. Wprowadzono aktualizacje do modeli Gemini, w tym Gemini 1.5 Pro i Gemini Nano, które oferują zaawansowane funkcje multimodalności (wyraźny trend 2024 roku). Google ogłosiło także Project Astra, nowego agenta AI opracowanego przez DeepMind, który charakteryzuje się zaawansowanym rozumieniem przestrzennym. Zaprezentowano nowe narzędzia generatywne, takie jak Imagen 3 do tworzenia obrazów, Veo do generowania wideo i Music AI Sandbox do eksperymentowania z muzyką. Wyszukiwarka Google została wzbogacona o funkcje generatywne, a Android 15 zyskał ulepszenia w zakresie prywatności i bezpieczeństwa, integrując zaawansowane AI. Ufff… sporo tego, a został jeszcze Apple!
Podczas swojej (czerwcowej) konferencji Apple, oprócz nowych systemów operacyjnych, zaprezentował także własną wersję AI… choć wcale nie taką własną. Apple Intelligence został zapowiedziany jako system AI od Apple, który będzie bazował na ChacieGPT.
Google@GoogleHere's a full recap of our news and updates from #GoogleIO — in under 10 minutes 🎉
3. Lipiec-wrzesień - wakacje w branży AI? Nic z tych rzeczy!
Wbrew pozorom okres wakacyjny wcale nie przyniósł spowolnienia w branży AI. W lipcu widzieliśmy prawdziwy wysyp i boom narzędzi AI i to zarówno tych do generowania wideo, jak i muzyki. Udio i Suno (generatory muzyki AI) stały się tak popularne, że zwróciły na siebie uwagę gigantów. Muzyczne wydawnictwa pozwały twórców narzędzi o bezprawne korzystanie z utworów ich artystów do trenowania swoich modeli.
Sierpień to rozkwit modeli do generowania wideo oraz grafik. Na rynek wchodzi model do generowania grafik Flux.1 od Black Forest Lab i z marszu nazwany jest mianem “Midjourney Killera”. Do gry w wideoAI wchodzą także Chiny, wypuszczając generatory Kling AI oraz Hailuo AI (MiniMax).
Sierpień to rozkwit modeli do generowania wideo oraz grafik. Na rynek wchodzi model do generowania grafik Flux.1 od Black Forest Lab i z marszu nazwany jest mianem “Midjourney Killera”. Do gry w wideoAI wchodzą także Chiny, wypuszczając generatory Kling AI oraz Hailuo AI (MiniMax).
Z dniem 1 sierpnia zaczyna także obowiązywać AI Act w krajach UE.
Mało? W sierpniu OpenAI prezentuje SearchGPT, czyli własną wyszukiwarkę. Ten miesiąc to także wzmożony szum nad pierwszym open-source’owym modelem LLM, czyli Bielikiem. We wrześniu z kolei giganci pokroju Google, Microsoft i Amazona zaczynają coraz poważniej myśleć o zasilaniu swoich centrów AI energią atomową.
Mało? W sierpniu OpenAI prezentuje SearchGPT, czyli własną wyszukiwarkę. Ten miesiąc to także wzmożony szum nad pierwszym open-source’owym modelem LLM, czyli Bielikiem. We wrześniu z kolei giganci pokroju Google, Microsoft i Amazona zaczynają coraz poważniej myśleć o zasilaniu swoich centrów AI energią atomową.

4. Październik-grudzień - rozpędzony pociąg AI nie zamierza się zatrzymywać
Ostatni kwartał 2024 roku przyniósł wiele wyczekiwanych (oraz nieoczekiwanych) rozwiązań i nowości. W październiku było głośno zarówno o Nagrodzie Nobla z Fizyki za przełomowe badania nad AI (dla Johna J. Hopfielda i Geoffrey’a E. Hintona), jak i chęci uniezależnienia się Chin od chipów H100 od Nvidii (będących sercem współczesnych systemów AI). Chińczycy ogłosili, że wraz z Huawei opracowali AI Ascend, czyli własne chipy AI, które swoimi wynikami dorównują hardware’owi od Nvidii. Jeśli chodzi o OpenAI, to w październiku zaprezentował nowe narzędzia, czyli Canvas - edytor treści wygenerowanych w ChacieGPT.
Listopad to dalsze prace Elona Muska nad własnym chatbotem opartym o sztuczną inteligencję - Grokiem. Z dniem 15 listopada wszyscy użytkownicy zgodzili się na trenowanie własnymi tweetami (X). Warto dodać, że dwa tygodnie później Grok został udostępniony wszystkim użytkownikom. 11 listopada firma ElevenLabs (narzędzia AI do generowania głosu) ogłosiła inwestycję 11 mln USD w Polsce. Założycielami ElevenLabs jest dwóch polaków - Mati Staniszewski oraz Piotr Dąbrowski.
Grudzień minął głównie pod znakiem kalendarza adwentowego od OpenAI. W ciągu 12 dni OpenAI zaprezentowało szereg nowości, takich jak pełna wersja modelu o1 (zaprezentowanego we wrześniu), premera Sory (w końcu, ale nie w UE), czy subskrypcja ChatGPT Pro w wysokości 200 USD miesięcznie. Google także pokazał w okresie przedświątecznym swoje nowości, takie jak Gemini 2.0 oraz generator wideo VEO 2, który zdeklasował oczekiwaną przez cały rok Sorę pod względem jakości i odwzorowywania fizyki.
Listopad to dalsze prace Elona Muska nad własnym chatbotem opartym o sztuczną inteligencję - Grokiem. Z dniem 15 listopada wszyscy użytkownicy zgodzili się na trenowanie własnymi tweetami (X). Warto dodać, że dwa tygodnie później Grok został udostępniony wszystkim użytkownikom. 11 listopada firma ElevenLabs (narzędzia AI do generowania głosu) ogłosiła inwestycję 11 mln USD w Polsce. Założycielami ElevenLabs jest dwóch polaków - Mati Staniszewski oraz Piotr Dąbrowski.
Grudzień minął głównie pod znakiem kalendarza adwentowego od OpenAI. W ciągu 12 dni OpenAI zaprezentowało szereg nowości, takich jak pełna wersja modelu o1 (zaprezentowanego we wrześniu), premera Sory (w końcu, ale nie w UE), czy subskrypcja ChatGPT Pro w wysokości 200 USD miesięcznie. Google także pokazał w okresie przedświątecznym swoje nowości, takie jak Gemini 2.0 oraz generator wideo VEO 2, który zdeklasował oczekiwaną przez cały rok Sorę pod względem jakości i odwzorowywania fizyki.

Co przyniesie 2025?
Jak widzisz w 2024 roku w branży AI działo się naprawdę sporo - a to i tak tylko powierzchowne muśnięcie najważniejszych wydarzeń i tematów. Co zatem przyniesie rok 2025?
Możemy spodziewać się przede wszystkim znaczącego rozwoju agentów AI, którzy będą coraz bardziej zaawansowani i zintegrowani z codziennymi zadaniami zarówno w biznesie, jak i życiu prywatnym. Wraz z postępem w obszarze sztucznej inteligencji, agentami AI staną się narzędzia zdolne do samodzielnego podejmowania decyzji, optymalizacji procesów czy przewidywania potrzeb użytkowników w czasie rzeczywistym.
Możemy spodziewać się przede wszystkim znaczącego rozwoju agentów AI, którzy będą coraz bardziej zaawansowani i zintegrowani z codziennymi zadaniami zarówno w biznesie, jak i życiu prywatnym. Wraz z postępem w obszarze sztucznej inteligencji, agentami AI staną się narzędzia zdolne do samodzielnego podejmowania decyzji, optymalizacji procesów czy przewidywania potrzeb użytkowników w czasie rzeczywistym.
Tego typu agenci, zbudowani na zaawansowanych modelach, będą zdolni do rozumienia kontekstu i adaptacji w dynamicznych środowiskach, a także integracji z różnymi systemami i platformami. Firmy zaczną wdrażać takie rozwiązania w obszarach zarządzania klientami, rozwoju produktów, a także w procesach automatyzacji. Równocześnie, pojawią się wyzwania związane z zapewnieniem przejrzystości i odpowiedzialności decyzji podejmowanych przez tych agentów, co wymusi rozwój bardziej zaawansowanych systemów audytu i etycznych ram dla sztucznej inteligencji. Oprócz tego oczywiście sporo nowych narzędzi i jeszcze więcej ram prawnych 😉
O autorze
Jeremiasz Krok
Zawodowy copywriter oraz social media manager. Od 5 lat publikuje treści w tematyce m.in. nowoczesnych technologii. W Bitcoin.pl zajmuje się nowościami z rynku, artykułami odnośnie kryptowalut oraz sztucznej inteligencji.

Poprzedni
Launchpool tokena BIO Protocol na Binance. Sektor biotech wchodzi na rynek kryptowalut

Następny
Wyciek fraz seed z portfeli kryptowalutowych! Tangem ma problem
Chcesz być na bieżąco? Zaobserwuj nas w
ObserwujGoogle News
Newsletter Bitcoin.pl
Najważniejsze newsy i insiderskie informacje prosto na Twój email.
Dbamy o ochronę Twoich danych. Polityka Prywatności

