O technicznych aspektach LLM-ów i AI dla nieinformatyków cz. 6 - "Kluczowe algorytmy AI"

Posłuchaj:

Udostępnij:

W erze transformacji cyfrowej, która obejmuje także finanse i zarządzanie, znajomość podstawowych mechanizmów sztucznej inteligencji staje się koniecznością. Nie chodzi o to, aby CFO umiał kodować modele, ale aby rozumiał, co się dzieje pod maską narzędzi, z których korzysta organizacja. Poniższe zestawienie to skrótowy przegląd najważniejszych algorytmów i metod oraz technik stosowanych w AI i nie tylko, z uwzględnieniem ich zastosowania w automatyzacji procesów.

Regresja liniowa (Linear regression). Jeden z najbardziej klasycznych modeli predykcyjnych. Przydatna wszędzie tam, gdzie chcemy prognozować wartości liczbowe, np. przychody czy ceny nieruchomości, w zależności od zmiennych wejściowych. W finansach to często pierwszy model, którym testujemy dane.

Przykład: Prognozowanie miesięcznych przychodów firmy na podstawie danych historycznych sprzedaży i sezonowości.

Regresja logistyczna (Logistic regression). Jeśli pytanie brzmi: "czy klient spłaci kredyt?" (tak lub nie), regresja logistyczna daje odpowiedź w formie prawdopodobieństwa. Używana w scoringu kredytowym, wykrywaniu fraudów, a także do klasyfikacji ryzyk procesowych. Po przekroczeniu ustalonego progu (np. 0.5), wynik jest interpretowany jako klasyfikacja binarna, czyli przypisanie jednostki do jednej z dwóch kategorii (np. 0 lub 1) na podstawie zestawu atrybutów wejściowych.

Przykład: Ocena ryzyka kredytowego klienta banku – model przewiduje prawdopodobieństwo spłaty kredytu na podstawie historii kredytowej i dochodów.

Drzewa decyzyjne (Decision trees). Model, który myśli jak kontroler: zadaje pytania, dzieli przypadki i prowadzi do decyzji. Proste do wizualizacji, często używane do automatyzacji reguł w procesach kredytowych czy compliance.

Przykład: Automatyczne podejmowanie decyzji o przyznaniu kredytu na podstawie zestawu reguł dotyczących wieku, dochodu i historii kredytowej klienta.

Las losowy (Random Forest). To algorytm uczenia maszynowego, który łączy wiele drzew decyzyjnych w celu uzyskania bardziej stabilnych i dokładnych wyników, niż pojedyncze drzewo decyzyjne. Do każdego drzewa wykorzystywane są losowo wybrane podzbiory danych treningowych i losowo wybrane cechy w każdym podziale. Wykorzystywany jest do prognozowania (np. popytu, przepływów pieniężnych) i analizy ryzyka.

Przykład: Prognozowanie zapotrzebowania na produkty w sklepie internetowym na podstawie danych sprzedażowych/zamówień z wielu lokalizacji.

Klasteryzacja metodą K-średnich (K-means clustering). K-means to algorytm, który podzieli dane na naturalne grupy. Model zakłada, że liczba grup (klastrów) musi być z góry określona, co może być wyzwaniem. Działa bez nadzoru, tylko na podstawie podobieństw. Jest często używany do kampanii marketingowych, pricingu dynamicznego czy analizy zachowań.

Przykład: Podział klientów banku na grupy w celu dopasowania ofert marketingowych, np. młodzi klienci korzystający z aplikacji mobilnej vs. starsi preferujący kontakt osobisty.

Naiwny klasyfikator Bayesa (Naive Bayes Classifier). Prosty, szybki. Skuteczność zależy od założeń o niezależności cech, które nie zawsze są spełnione, a model zakłada, że wszystkie cechy (atrybuty wejściowe) są od siebie statystycznie niezależne, pod warunkiem znajomości klasy. Klasyfikuje dane tekstowe (np. czy mail to spam), opierając się na prawdopodobieństwach. Użyteczny przy sortowaniu wiadomości, analizie opinii klientów czy dokumentów.

Przykład: Klasyfikacja e-maile jako „spam” lub „nie-spam” na podstawie słów, które się w nich pojawiają.

Maszyna wektorów nośnych / wspierających (Support Vector Machines). Algorytm, który szuka granicy pomiędzy klasami danych. W finansach stosowany np. do analizy zdolności kredytowej albo klasyfikacji klientów na podstawie cech demograficznych i behawioralnych.

Przykład: Klasyfikacja klientów jako potencjalnie zainteresowanych kredytem hipotecznym - lub nie - na podstawie ich aktywności w serwisie bankowym.

Sieci neuronowe (Artificial Neural Network). To nie magia, to jest system warstw przetwarzających dane. Używane do wykrywania wzorców, np. w fraudach transakcyjnych czy scoringu. Mają zastosowanie wszędzie tam, gdzie złożoność danych przekracza mozliwości "ludzkiego oka".

Przykład: Wykrywanie podejrzanych transakcji kartą kredytową na podstawie wzorców zachowań klienta.

Wzmacnianie gradientowe (Gradient Boosting). Zamiast jednego mocnego modelu – wiele słabych, które się wzajemnie poprawiają. Zakłada budowanie drzew decyzyjnych, z których każde kolejne w iteracyjnym procesie staje się doskonalsze od poprzedniego. Ostateczny model agreguje całą serię drzew. Bardzo dokładny algorytm, używany w scoringu kredytowym, predykcji churnu czy rankingach ryzyka.

Przykład: Model przewidujący prawdopodobieństwo odejścia klienta z usług finansowych na podstawie historii interakcji i transakcji.

Algorytm K- Najbliżsi Sąsiadzi (K-Nearest Neighbors). Model typu "pokaż mi najbardziej podobnych do tego klienta". Prosty, ale skuteczny przy systemach rekomendacyjnych, np. produkty, usługi finansowe czy ryzyka podobne do obserwowanych.

Przykład: Rekomendacja produktów inwestycyjnych klientowi na podstawie preferencji i profilu podobnych użytkowników.

11. Analiza głównych składowych (Principal Component Analysis). Statystyczna technika redukcji wymiarów polegająca na dekompozycji macierzy kowariancji (lub macierzy korelacji) danych w celu wyodrębnienia komponentów tłumaczących jak największą część wariancji (miara zmienności). Umożliwia np. zredukowanie 50 KPI do 3 głównych składowych wyjaśniających np. 80 – 90 % całkowitej wariancji. Liczbę komponentów wybiera się na podstawie udziału wyjaśnionej wariancji. PCA jest powszechnie stosowana w analizie portfelowej, optymalizacji i wizualizacji danych wysokowymiarowych.

Przykład: Redukcja liczby wskaźników finansowych w analizie portfela inwestycyjnego do kilku najważniejszych komponentów.

Sieci rekurencyjne (Recurrent Neural Network). Są to sieci uczące się sekwencji. Działają dobrze przy szeregach czasowych, czyli np. przy predykcji cash flow, cykli koniunkturalnych czy zachowań klienta w czasie.

Przykład: Prognozowanie przepływów pieniężnych firmy na podstawie danych z poprzednich miesięcy.

Algorytmy genetyczne (Genetic algorithms). Inspiracja biologią. To rodzaj algorytmu przeszukującego przestrzeń alternatywnych rozwiązań problemu w celu wyszukania rozwiązań najlepszych. Poprzez symulację "ewolucji" szukają najlepszego rozwiązania. Używane w logistyce, zarządzaniu łańcuchem dostaw, czasem też w modelowaniu scenariuszowym.

Przykład: Optymalizacja tras dostaw w firmie logistycznej w celu minimalizacji kosztów transportu.

Długa pamięć krótkotrwała (Long Short-Term Memory). Specjalna wersja RNN, która lepiej radzi sobie z długimi zależnościami czasowymi. W predykcji trendów rynkowych, zmian zachowań klienta albo danych finansowych z długim ogonem.

Przykład: Analiza długoterminowych trendów sprzedaży produktów sezonowych w celu lepszego planowania zapasów.

Przetwarzanie języka naturalnego (Natural Language Processing). Technologie przetwarzania języka naturalnego mające zastosowanie od prostych chatbotów po ekstrakcję danych ze skomplikowanych umów i sprawozdań. Więcej o zastosowaniach NLP w kontrolingu przeczytasz tutaj https://dfe.org.pl/llm-rag/

Przykład: Automatyczne wyodrębnianie kluczowych informacji z umów finansowych, takich jak daty płatności czy warunki kredytowe.

Optymalizacja kolonii mrówek (Ant Colony Optimization). Metaheurystyka, czyli klasa metod optymalizacyjnych do rozwiązywania problemów obliczeniowych, sprawdzająca się w problemach trasowania (wyznaczaniu jakiejś drogi, zakresu, granic), rzadko stosowana w finansach. Algorytm inspirowany sposobem, w jaki mrówki znajdują najkrótszą drogę. Działa skutecznie w optymalizacji tras, harmonogramów czy przepływów produkcyjnych.

Przykład: Planowanie tras dostaw dla floty pojazdów w firmie kurierskiej, tak aby zminimalizować łączny czas przejazdu i koszty paliwa. Algorytm kolonii mrówek znajduje najbardziej efektywne ścieżki między punktami dostaw, uwzględniając ograniczenia czasowe i geograficzne.

Osadzanie słów (Word Embeddings). Reprezentacja słów jako wektorów, które odzwierciedlają ich znaczenie. W praktyce: lepsze wyszukiwanie dokumentów, analiza opinii czy mapowanie tematów w tekstach.

Przykład: Wyszukiwanie podobnych dokumentów finansowych na podstawie znaczenia słów, a nie tylko ich występowania.

Gaussowski model mieszany (Gaussian Mixture Model). Model statystyczny, który zakłada, że dane pochodzą z wielu nakładających się rozkładów. Używany do wykrywania anomalii, np. nietypowych transakcji.

Przykład: Wykrywanie nietypowych transakcji w systemie bankowym, które mogą wskazywać na oszustwo.

Uczenie się reguł asocjacyjnych (Association Rule Learning). Klasyczna analiza koszyka zakupowego. Szuka wzorców współwystępowania, np. klient kupujący produkt A często kupuje też B. Przekładalne na finanse: produkty komplementarne, sekwencje decyzji itp.

Przykład: Identyfikacja produktów, które są często kupowane razem, np. karta kredytowa i ubezpieczenie podróżne.

Uczenie przez wzmacnianie (Reinforcement Learning). Uczenie przez doświadczenie i wzmocnienie. Algorytm podejmuje decyzje, uczy się na podstawie "nagród" i "kar". W praktyce: dynamiczne zarządzanie ceną, portfelem, strategią.

Przykład: Dynamiczne dostosowywanie cen usług finansowych w zależności od reakcji klientów i warunków rynkowych.

Powyższe algorytmy znajdują zastosowanie w budowie agentów AI i systemów rekomendacyjnych, o czym piszę szerzej w artykułach:

o agentach AI https://dfe.org.pl/budowa-agentow-ai/
o systemach LangChain https://dfe.org.pl/o-technicznych-aspektachllm-langchain/
o wykorzystaniu LLM w analizie dokumentów https://dfe.org.pl/llm-rag/

Bartosz Radziszewski

Inne artykuły tego cyklu

O technicznych aspektach LLM-ów i AI dla nieinformatyków, cz. 1. „Retrieval-Augmented Generation (RAG)”

O technicznych aspektach LLM-ów i AI dla nieinformatyków, cz. 2. „Model Context Protocol (MCP)”

O technicznych aspektach LLM-ów i AI dla nieinformatyków, cz. 3. „Automatyzacja zakupów konsumenckich”

O technicznych aspektach LLM-ów i AI dla nieinformatyków, cz. 4. „Budowa Agentów AI”

O technicznych aspektach LLM-ów i AI dla nieinformatyków, cz. 5. „Skrzynka narzędziowa LangChain” (LC)

Bartosz Radziszewski