„Google“ realaus laiko rankų sekimo algoritmas naudoja išmanųjį telefoną, kad pagerintų gestų kalbos atpažinimą

Tech / „Google“ realaus laiko rankų sekimo algoritmas naudoja išmanųjį telefoną, kad pagerintų gestų kalbos atpažinimą 2 minutės perskaityta Rankinis sekimas realiuoju laiku

Rankinis sekimas realiuoju laiku



Gestų kalbą vartoja milijonai žmonių visame pasaulyje. Mokslininkai stengėsi kurti technologijas, kurios galėtų suprasti gestus ir automatiškai paversti juos žmonėms suprantama kalba. Tačiau tikslumo požiūriu tokie projektai nesulaukė didžiulės sėkmės.

„Google“ neseniai sukūrė algoritmą, kurį galima naudoti realiuoju laiku stebint rankas. Pažangi sistema naudoja mašininį mokymąsi, kad būtų sukurtas rankos žemėlapis. Žemėlapis sukurtas fotoaparato ar išmaniojo telefono pagalba. Negalime paneigti fakto, kad daugumai sistemų nepavyksta tiksliai užfiksuoti greitų rankų judesių. „Google“ šiame tyrime specialiai sprendė šią problemą. Įdomu tai, kad jie apribojo duomenų kiekį, kurį anksčiau apdorojo algoritmai.

Kaip veikia rankų stebėjimas realiuoju laiku?

Dauguma esamų projektų verčia gestų kalbą, nustatydami visos rankos dydį ir padėtį. Su šiuo tyrimu. mokslininkai pašalino poreikį tvarkyti įvairaus dydžio stačiakampes formas. „Google“ sistema tiesiog atpažįsta kvadrato formos delną. Antra, atliekamas atskiras pirštų analizės procesas.



„Google“

Rankos gestai



Mokslininkai naudojo apie 30 000 rankų vaizdų mokydami mašininio mokymosi algoritmo. Šie vaizdai buvo užfiksuoti skirtingomis apšvietimo sąlygomis ir pozomis. Tada sistema aptinka gestą, palygindama rankos pozą ir žinomų subjektų, tokių kaip kamuolys ar laimė, sąrašą. „Google“ apibūdina gestų atpažinimą a tinklaraščio straipsnis .

Tada pirštų būsenų rinkinį susiejame su iš anksto nustatytų gestų rinkiniu. Ši paprasta, tačiau veiksminga technika leidžia mums pagrįstai įvertinti pagrindinius statinius gestus. Esamas vamzdynas palaiko daugelio kultūrų skaičiavimo gestus, pvz. Amerikietiški, europietiški ir kiniški ženklai bei įvairūs rankų ženklai, įskaitant „Thumb up“, uždarą kumštį, „OK“, „Rock“ ir „Spiderman“.

Galutinis rankų sekimo algoritmas pateikia pažangiausius rezultatus, atsižvelgiant į jo greitį ir tikslumą. Algoritmas naudoja „MediaPipe“ sistemą. Ši technika atrodo kaip didelė pažanga gestų kalbos srityje. Nors vis dar yra kur tobulėti. siekiant geriau suprasti gestų kalbą. Kiekvienas gali pratęsti šį darbą naudodamas veido išraiškas ir abi rankas, kad pasiektų geresnių rezultatų.



Nors „Google“ nėra nė vieno žodžio, yra tikimybė, kad „Google“ gali patobulinti šią realaus laiko rankinio stebėjimo technologiją, kad galėtų ją naudoti savo produktuose. Tuo tarpu, jei norite pažaisti su kodu, jis yra viešai prieinama „GitHub“ .

Žymos google