సంక్లిష్ట వాతావరణంలో, AI కంటే మానవులు ప్రసంగం యొక్క అర్థాన్ని బాగా అర్థం చేసుకోగలరు, ఎందుకంటే మనం మన చెవులను మాత్రమే కాకుండా మన కళ్ళను కూడా ఉపయోగిస్తాము.
ఉదాహరణకు, మనం ఒకరి నోరు కదులుతున్నట్లు చూస్తాము మరియు మనకు వినిపించే శబ్దం తప్పనిసరిగా ఆ వ్యక్తి నుండి వస్తుందని అకారణంగా తెలుసుకోవచ్చు.
Meta AI కొత్త AI డైలాగ్ సిస్టమ్పై పని చేస్తోంది, ఇది సంభాషణలో చూసే మరియు వినే వాటి మధ్య సూక్ష్మమైన సహసంబంధాలను గుర్తించడం కూడా AIకి నేర్పడం.
లేబుల్ చేయని వీడియోల నుండి దృశ్య మరియు శ్రవణ సూచనలను నేర్చుకోవడం ద్వారా ఆడియో-విజువల్ స్పీచ్ విభజనను ప్రారంభించడం ద్వారా మానవులు కొత్త నైపుణ్యాలను ఎలా నేర్చుకోవాలో అదే విధంగా VisualVoice నేర్చుకుంటుంది.
యంత్రాల కోసం, ఇది మెరుగైన అవగాహనను సృష్టిస్తుంది, అయితే మానవ అవగాహన మెరుగుపడుతుంది.
ప్రపంచం నలుమూలల నుండి సహోద్యోగులతో కలిసి మెటావర్స్లో గ్రూప్ మీటింగ్లలో పాల్గొనడం, వర్చువల్ స్పేస్లో కదులుతున్నప్పుడు చిన్న గ్రూప్ మీటింగ్లలో చేరడం వంటివి ఊహించుకోండి, ఆ సమయంలో దృశ్యంలో ధ్వని రివర్బ్లు మరియు టింబ్రేలు పర్యావరణానికి అనుగుణంగా సర్దుబాటు చేస్తాయి.
అంటే, ఇది ఒకే సమయంలో ఆడియో, వీడియో మరియు వచన సమాచారాన్ని పొందగలదు మరియు ధనిక పర్యావరణ అవగాహన మోడల్ను కలిగి ఉంటుంది, వినియోగదారులకు "వెరీ వావ్" సౌండ్ అనుభవాన్ని కలిగి ఉంటుంది.
పోస్ట్ సమయం: జూలై-20-2022