Kanadyjska firma Maluuba, którą niedawno wykupił Microsoft, stworzyła sztuczną inteligencję, która w dość ciekawy sposób była zdolna skończyć grę Ms Pac-Man z idealnym wynikiem 999 990 punktów. Wyczyn ten wymagał stworzenia sieci 150 „dronów”, które pod batutą jednego głównego systemu wypracowały sposób na pokonanie tej klasycznej gry.
System stworzony przez firmę Maluuba opiera się na wymuszonym uczeniu w celu stworzenia strategii działania. Jest to technika, która opiera się wybieraniu algorytmów zapewniających lepsze rezultaty i zniechęcaniu do korzystania z pozostałych. Założenie jest takie, że po jakimś czasie system będzie w stanie sam zdecydować jakie rozwiązanie problemu przyniesie najlepsze efekty. Problem jednak polega na tym, że idea ta choć skuteczna, wymaga czasu. Można to przyrównać do teorii, która głosi, że po odpowiednio długim czasie nawet małpy ślepo stukające w klawisze maszyny do pisania byłyby w stanie odtworzyć dzieła Szekspira.
Aby rozwiązać ten problem zespół Maluuba zaprzągł do pracy 150 niezależnych sieci neuronowych i dał im to samo zadanie. Nad ich progresem i wynikami czuwał z kolei jeden główny system, który analizował rezultaty poszczególnych członków zespołu i określał ich efektywność. Następnie informował resztę o swoich wnioskach i tym samym wprowadzał potrzebne korekty w działaniach. Firma nazwała ten system Hybrid Reward Architecture.
W takim scenariuszu pokonanie gry z idealnym wynikiem było tylko formalnością. Microsoft pragnie z pomocą nowego systemu uczynić AI szybszym i bardziej niezawodnym.