LINUX &&|| PROGRAMMING

C.d: https://t.me/ProgramowanieLinux/1171 #src: https://www.facebook.com/groups/sztucznainteligencja.biz/permalink/1458738451702549/ #Qstar

Słyszeliście już o tzw. Q-Star (Q*) nad którym się spuszczają ostatnio wszelkie "autorytety" na forach internetowych podniecając się rewolucją w uczeniu maszynowym...

Jakimś przełomem technologicznym w dziedzinie stworzenia #AI superinteligencji i super nadinteligencji... tworzą jakieś spiskowe teorie... ? Wiecie o co tu chodzi?

Wyjaśnię...

Chodzi o technikę uczenia maszynowego ze wzmocnieniem tzw. [#ReinforcementLearning].

Wykorzystując algorytm Q-Learning... Oczywiscie temat znany jest od 1989 roku a Q-Learning został znacząca ulepszony. Żadna nowość.

Modele językowe szkolone są z użyciem algorytmów takich jak Q-Learning i pochodne np. #DQN i jego odmiany #RAINBOW... to cala gałąź #machinlearning-u polegająca na uczeniu ze wzmocnieniem, czyli biega o to, że agenta takiego jak #Bard/#Bing i w najnowszej wersji (tej po 3.5) prawdopodobnie będzie tak uczony też #ChatGPT... bo do tej pory był to model, który nie był uczony tymi metodami.
Nie mial dostępu do internetu i w przeciwieństwie do Bard i Bing był bezpieczny.

Teraz to się zmieni...

Q-Learning został po raz pierwszy opisany w 1989 roku przez dwóch naukowców z Uniwersytetu Kalifornijskiego w Berkeley, Christophera Watkinsa i Petera Dayana. #Algorytm został nazwany na cześć funkcji wartości Q, którą wykorzystuje do reprezentowania przewidywanej wartości nagrody dla danego stanu i akcji.

Q-Learning został szybko przyjęty przez społeczność uczenia maszynowego i został wykorzystany do rozwiązania wielu różnych problemów, w tym:

* Sterowanie robotami
* Gry komputerowe
* Zarządzanie portfelem
* Zarządzanie ryzykiem

Oto kilka przykładów zastosowań Q-Learning w nauczaniu maszynowym:

* Sterowanie robotami: Q-Learning został wykorzystany do wyszkolenia robotów, aby wykonywały złożone zadania, takie jak gra w piłkę nożną lub chodzenie po nierównym terenie.

* Gry komputerowe: Q-Learning jest często używany w grach komputerowych do nauczenia agentów, jak grać. Na przykład Q-Learning został wykorzystany do wyszkolenia agentów, aby grać w gry takie jak Go, StarCraft i Dota 2.

* Zarządzanie portfelem: Q-Learning może być używany do zarządzania portfelem inwestycyjnym, aby zmaksymalizować zwrot z inwestycji. Na przykład Q-Learning został wykorzystany do wyszkolenia agentów, aby podejmować decyzje inwestycyjne w czasie rzeczywistym.

* Zarządzanie ryzykiem: Q-Learning może być używany do zarządzania ryzykiem w różnych kontekstach, takich jak ubezpieczenia, finanse i bezpieczeństwo. Na przykład Q-Learning został wykorzystany do wyszkolenia agentów, aby podejmować decyzje o ubezpieczeniu, które zminimalizują ryzyko straty.

Q-Learning jest po prostu bardzo potężnym algorytmem uczenia maszynowego, który może być wykorzystywany do rozwiązania szerokiego zakresu problemów.

#Qstar #Qlearning

82 viewsedited 13:44

About

Blog

Apps

Platform