Algorytmy uczenia maszynowego

Algorytm słowny był kiedyś czymś, o czym rozmawiały tylko osoby zajmujące się rachunkiem różniczkowym. Teraz koncentrują się na nim również dziennikarze i zespoły marketingowe. Liczy się to, co z nim zrobisz. Należy zauważyć, że nie wszystkie algorytmy są związane ze sztuczną inteligencją lub uczeniem maszynowym, ale na potrzeby artykułu skoncentrujemy się właśnie na nich.

 Na przykład wyobraź sobie, że musisz posortować milion plików ze słowem “niebieski”. Nawet jeśli zajęłoby Ci to tylko jedną sekundę na plik, musiałbyś je segregować przez ponad 11 dni bez przerw na sen, jedzenie, czy toaletę. Jeśli jednak wykorzystasz do tego komputer z wystarczającą mocą obliczeniową i odpowiednimi algorytmami, zajmie mu to prawdopodobnie kilka sekund.

Co to jest sztuczna inteligencja i uczenie maszynowe?

Mówiąc najprościej, sztuczna inteligencja to nauka polegająca na zmuszaniu maszyn do myślenia i podejmowania decyzji tak, jak robią to ludzie. Takie maszyny i roboty stosowane są w wielu dziedzinach, w tym rolnictwie, opiece zdrowotnej, robotyce, marketingu i analizie biznesowej.

Zasadniczo algorytmy pobiera dane wejściowe oraz wykorzystuje matematykę i logikę do uzyskania danych wyjściowych. Jednak algorytm sztucznej inteligencji przyjmuje równocześnie dane wejściowe i wyjściowe, by nauczyć się ich i generować dane wyjściowe, gdy otrzyma wejściowe. Taki proces uczenia maszyn na podstawie danych określamy uczeniem maszynowym.

 Algorytmy uczenia maszynowego		 

Kilka popularnych algorytmów

Regresja liniowa służy do oszacowania wartości dyskretnych (zwykle binarnych, takich jak 0/1) na podstawie zestawu zmiennych zależnych.

Drzewo decyzyjne obecnie jest jednym z najpopularniejszych algorytmów uczenia maszynowego. Służy do klasyfikowania problemów zarówno zmiennych kategorycznych, jak i ciągłych zależnych.

Z kolei SVM to metoda klasyfikacji, w której wykreślane są surowe dane jako punkty w przestrzeni n-wymiarowej (gdzie n oznacza liczbę posiadanych elementów). 

Warto też zwrócić uwagę na naiwny klasyfikator Bayesa. Zakłada, że obecność określonej cechy w klasie nie jest związana z obecnością żadnej innej cechy. Sprawdza się w przypadku ogromnej liczby danych.

Algorytm KNN można zastosować zarówno do problemów z klasyfikacją, jak i regresją. Warto pamiętać, że dane muszą być wstępnie przetworzone.

K-średnich to nienadzorowany algorytm, który rozwiązuje problemy klastrowania. 

 Algorytmy uczenia maszynowego		 

Niebezpieczny system GPT-2

Laboratorium badawcze openai stworzyło pełną wersję systemu AI generującego tekst. Eksperci ostrzegają, że może być użyty do niebezpiecznych celów. Na samym początku instytut ogłosił wydanie systemu GPT-2 w lutym 2019, ale wstrzymało jego pełną wersję ze strachu, że zostanie wykorzystany do rozpowszechniania fałszych informacji, spamu, kradzieży tożsamości i manipulacji treściami w mediach społecznościowych. Od tego czasu wydano mniejsze, mniej złożone wersje GPT-2 i sprawdzano ich zastosowanie. 

Model językowy wymaga krótkiego wprowadzenia tematycznego, na którym oprze się cały tekst, dostosowując do stylu wprowadzania. Pozwala przewidywać następne słowo, a tym samym pisać spójny tekst.