Jeśli korzystałeś już z ChataGPT, przejdź do „Różnice”.
Large Language Models (LLM-y) to zaawansowane modele językowe będące sztucznymi inteligencjami, które mogą analizować, rozumieć i generować ludzki język. Są to potężne narzędzia stosowane w dziedzinie przetwarzania języka naturalnego (Natural Language Processing, NLP).
LLM-y opierają się na głębokich sieciach neuronowych, takich jak Transformers, umożliwiających uczenie się z dużych zbiorów tekstowych. Głównym zadaniem LLM-ów jest przetwarzanie i generowanie tekstu, co oznacza, że mogą wykonywać różnorodne zadania językowe, takie jak:
- Tłumaczenie maszynowe: LLM-y potrafią przekształcać tekst z jednego języka na inny, starając się zachować jego znaczenie.
- Generowanie tekstu: mogą tworzyć długie teksty, takie jak artykuły, opowiadania lub wiersze, w różnym stopniu imitujące utwory napisane przez człowieka.
- Rozpoznawanie mowy: wspomagają w rozpoznawaniu i przetwarzaniu mowy na teskt.
- Analiza sentymentu: potrafią rozpoznawać emocje wyrażane przez teksty i przyporządkowywać im odpowiednie oznaczenia.
- Odpowiadanie na pytania: LLM-y mogą odpowiadać na pytania na podstawie dostępnych informacji.
- Sumaryzacja tekstu: potrafią skracać długie teksty, zachowując istotne informacje, aby utworzyć streszczenie, podsumowanie lub listę najważniejszych punktów.
Popularne przykłady LLM-ów to modele takie jak GPT-3 (Generative Pre-trained Transformer 3) stworzony przez OpenAI, BERT (Bidirectional Encoder Representations from Transformers) opracowany przez Google i wiele innych.
LLM-y mają ogromne znaczenie dla różnych zastosowań. Wykorzystuje się je m.in. w asystentach głosowych, przy tłumaczeniach, generowaniu treści, analizie danych tekstowych i w wielu innych dziedzinach, które korzystają i mogą czerpać korzyści z przetwarzania języka naturalnego.
Wśród najbardziej znanych LLM-ów wyróżniają się Chat GPT od OpenAI oraz Bard od Google’a. ChatGPT jest dostępny od pewnego czasu, podczas gdy Bard został zaprezentowany w lutym 2023 i – choć nieco mniej popularny – również znajduje swoje zastosowania. Aby bliżej poznać Barda, postanowiliśmy przetestować go, stawiając go przed kilkoma zadaniami i sprawdzając, czym jego działanie różni się od dostępnej bez opłat wersji ChatGPT.
Różnice
Google LLM zaznacza już na wstępie, że jest w fazie nauki i prosi, abyśmy mieli to na uwadze. Jednak pierwszą znaczącą różnicą, która rzuca się w oczy, jest fakt, że Bard jest połączony z internetem i korzysta z Google Search. Taką funkcję udostępnia też ChatGPT – jednak wyłącznie w wersji płatnej. Tym samy Bard pod tym względem ma zdecydowaną przewagę.
Kolejnym aspektem, który przyciąga uwagę, jest Speech Recognition. W przeciwieństwie do ChatGPT, Bard pozwala na dyktowanie swoich promptów. Bard radzi sobie z tym zadaniem całkiem nieźle, niestety, na razie można do niego mówić tylko w jednym języku 😉
Bard daje nam również możliwość odsłuchania swoich odpowiedzi – to miły ukłon w stronę użytkowników i idei dostępności. W tym przypadku radzi sobie już nie tylko w języku angielskim.
Bard na pewno wygrywa w porównaniu z ChatGPT, jeśli chodzi o pracę z obrazami – oferuje możliwość dodawania zdjęć do swoich promptów w celu: uzyskania opisu, propozycji tekstu na podstawie zdjęcia, uzupełnienia informacji, a także wyszukania podobnych obrazów w internecie.
Pluginy
Jednym z istotnych atutów ChatGPT są wtyczki, których Bardowi na razie brakuje. Wtyczki są stosunkowo łatwe do instalowania i znacząco podnoszą użyteczność ChataGPT. Poniżej przedstawiamy kilka godnych uwagi dodatków, które mogą okazać się przydatne.
WOLFRAM
Wtyczka Wolfram sprawia, że ChatGPT staje się bardziej wiarygodny i użyteczny – zyskuje dostęp do obliczeń, poprawnej matematyki, wyselekcjonowanej i zweryfikowanej wiedzy, danych zbieranych w czasie rzeczywistym oraz wizualizacji. Wszystko to dzięki wykorzystaniu Wolfram Language i Wolfram Alpha.
ChatWithPDF
Ta wtyczka jest idealnym rozwiązaniem, jeśli brakuje nam czasu lub musimy pracować na dużej ilości danych w formacie pdf. Na przykład wtedy, gdy zwykłe wyszukiwanie w pliku nie przynosi oczekiwanych rezultatów, bo kluczowe słowo występuje w dokumencie 2137 razy. ChatWithPDF pozwala na interakcję z Twoim dokumentem pdf w formie konwersacji.
LinkReader
Jeśli na co dzień korzystasz z ChatGPT w jego darmowej wersji 3.5, czasami może Ci brakować dostępu do wiedzy z internetu. W takich przypadkach warto skorzystać z LinkReader, który umożliwia zasilenie promptu wiedzą z podanego przez Ciebie linku.
KeyMate AI Search
Chociaż Bard wyprzedza ChatGPT dzięki swoim zintegrowanym możliwościom korzystania z Google Search, ChatGPT również został wyposażony w plugin, który otwiera przed nim te same możliwości.
ShowMe
Jeśli w Twojej pracy istotne są nie tylko dane tekstowe lub jesteś osobą preferującą analizę wizualną, ten plugin może okazać się istotnym narzędziem. Show me pomaga w zwizualizowaniu danych tekstowych za pomocą grafów, diagramów, wykresów czy obrazków, wykorzystując Google Images, Plotly, Google Maps i Draw.io.
Niezależnie od tego, z pomocy jakich LLM-ów korzystamy, należy zawsze pamiętać, że sposób ich działania i uczenia się, będzie zawsze narażał je na możliwości wystąpienia halucynacji – często przybierających bardzo przekonującą formę, na której prawdziwość łatwo się nabrać. Wynika to z tego, że każdy LLM wie tyle, ile został nauczony. Im więcej dostał przykładów na dany temat – tym lepiej poradzi sobie z wyizolowaniem i opisaniem danego pojęcia. Tyle że nie wie, jak mało wie. A zapytany o coś, czego nie wie – zaczyna budować relacje na podstawie „dalekich skojarzeń”, konfabulować.
Stąd też, między innymi, przydatność takich pluginów jak LinkRead czy Wolfram, pozwalających na przykład na nakarmienie LLM-a w kontekście konkretnego zapytania, zweryfikowaną wiedzą.
Który lepszy?
Odpowiedź, oczywiście, brzmi: „to zależy”. Oba popularne LLM-y mają swoje ograniczenia i rozwiązania przydatne w wielu codziennych i niecodziennych sytuacjach. Dlatego warto wypróbować je w kontekście swoich potrzeb i… korzystać z tego, który bardziej nam odpowiada do konkretnego zadania.