Treterezh emgefre al lavar

Krogit e-barzh !
Un danvez pennad eo ar pennad-mañ ha labour zo d'ober c'hoazh a-raok e beurechuiñ.
Gallout a rit skoazellañ Wikipedia dre glokaat anezhañ


Treterezh emgefre al lavar a zo ur skourr etrediskiblezh eus an urzhiataerezh hag eus ar c'hlaskerezh roadoù. E bal pennañ zo klask degas d'an urzhiataerioù barregezhioù evit tretiñ hag embregañ lavar an den. Gantañ e c'heller ober war-dro restroù roadennoù, korpusoù testennoù pe korpusoù komzoù, evit sevel un deskoni ardivinkel fardet diwar hentennoù a c'hell bezañ reolluniet pe tebegourel. Reiñ d'un urzhiataer ar ouestoni da dizhout ur seurt komprenezon eus an endalc'hioù, eus an arlivioù kemperzhel staget outo, eo an disoc'h da gaout. Pennaennoù hag a zeu eus ar yezhoniezh a vez implijet evit diboullañ ar stlenn arveradus, asamblez gant ar pezh a c'hell degas spiswel ha perzhegezh, koulz hag rummata hag aozañ an unpezhioù stlenn o-unan. Gant naouerezh ar gomz, komprenezon al lavar naturel ha krouidigezh al lavar naturel e ya diazezoù treterezh al lavar.

treterezh emgefre al lavar
diskiblezh akademek, tachenn studi, field of study, industry
Iskevrennad eusnaouegezh artifisiel, stlenneg, stlennyezhouriezh, diskiblezh akademek Kemmañ
Anv berrNLP, TAL, TALN Kemmañ
HashtagNLProc Kemmañ
Pleustret gantnatural language processing engineer Kemmañ
Tikedenn Stack Exchangehttps://stackoverflow.com/tags/nlp Kemmañ

Istor

Turing e 1936, e Princeton

Er bloavezhioù 1950 e krog ar studi efedus eus treterezh al lavar gant ardivinkoù, ar re savet evit an urzhiataerezh o tiwan, da gentañ-holl. Gwelet e vez ar studiadenn embannet gant Alan Turing, "Computing machinery and intelligence"[1][2], evel an destenn damkaniel diazez. En e bennad e kinnige un doare da briziañ kalite an naouegezh ardivinkel a vo graet Prouad Turing anezhañ diwezhatoc'h. Muzuliañ a ra ar prouad live speredegezh un ardivink diouzh barregezh ur programm divizoù da dremen evit un den : e-kerzh un eskemm kemennadennoù skrivet e ret d'un den divinout hag eñ emañ o kenskrivañ gant un ardivink pe gant un den all. Meno un implijer hepken avat a zepant diouzh re a faktorioù stag ouzh e endro evit bezañ gwelet evel ur reolenn[3].

E 1954 e voe kaset "arnod Georgetown" da benn gant Skol-veur Georgetown, gant sikour IBM. Klask a raed treiñ e saozneg en un doare emgefreek penn-da-benn en tu all da dri-ugent frazenn rusianek romanekaet a denne da dachennoù evel ar politikerezh, ar gwir, ar matematik pe ar skiant. Lavarout a rae an aozerien an taol-arnod e vefe posubl sevel an treiñ emgefre dindan tri pe pemp bloavezh. Splann eo avat e oa bet choazet ar frazennoù rusianek gant aked hag e oa bet prientet an niver a oberatadennoù sevenet evit an anatadur evit gerioù ha frazennoù resis. Ouzhpenn, ne oa ket a zielfennadur eus an darempredoù pe eus an ereadurezh da anavezout framm ar frazennoù. Diazezet e oa an hentenn implijet war ur geriadur ma oa liammet ar ger-mañ-ger ouzh reolennoù ha doareoù-ober resis[4].
Kalz gorrekoc'h ha dipitus e voe an araokadennoù avat. Hervez ur studiadenn eus ar Stadoù-Unanet, danevell an ALPAC savet e 1966[5], ne oa ket bet tizhet ar palioù gortozet goude dek bloavezh imbourc'h. Pa en em rentas kont an enklaskerien eus kemplezhded vras ar yezhoù e teuas palioù al labourioù enklask da vezañ kalz uveloc'h.

A-drugarez d'ar penndiazezoù degaset gant Turing e teuas Joseph Weizenbaum a-benn da sevel, etre 1964 ha 1966, ar c'hentañ aotomat divizer gouest da douellañ un den ha da dremen evit un den all[6]. An aotomat, ELIZA e anv, a oa sañset tremen evit ur psikoterapour, a zeue a-benn a-wezhioù da skoulmañ eskemmoù damheñvel ouzh an eskemmoù etre an dud, ken ez eo souezhus, daoust ma ne rae gant hogos titour ebet diwar-benn preder pe fromoù mab-den. Da skouer, pa'z ae ar « c'hlañvour » en tu all da varregezhioù izel ar bank anaoudegezhioù, e c'halle ELIZA reiñ ur respont jenerek, evel « Perak e lavarit ho peus poan-benn ? » evit respont da « Poan-benn am eus ».

E diwezh ar bloavezhioù 1960, Terry Winograd, ur c'hlasker eus an MIT, a savas ur programm e lavar naturel a oa SHRDLU e anv (distagañ « chreudeul »). A-drugarez dezhañ e c'halle an implijer divizout gant un urzhiataer da verañ ur « bed kuboù » (a blocks world) a c'halled gwelet war unan eus ar skrammoù kentañ. Ar c'hentañ programm e oa a-gement a ouie kompren ha seveniñ urzhioù kemplezh roet e lavar naturel. Tout ar pezh a c'halle ober avat a oa kemer kuboù, cheñch lec'h dezhe, o bodañ pe o divodañ. Ne c'hallas morse kompren kement a c'hall an dud ober gant traezoù fizikel[7].

E-pad ar bloavezhioù 1970, kalz programmourien zo kroget da skrivañ « ontologiezhioù meizadel », a oa o fal urzhiañ an titouroù e roadoù a c'halle bezañ komprenet gant un urzhiataer. Emañ MARGIE (Schank, 1975), SAM (Cullingford, 1978), PAM (Wilensky, 1978), TaleSpin (Meehan, 1976), SCRUPULE (Lehnert, 1977), Politics (Carbonell, 1979), ha Plot Units (Lehnert, 1981).

En miz Genver 2018, patromoù naouegezh diorroet gant Microsoft hag Alibaba a zeuas a-benn, pep hini diouzh e du, d'ober gwelloc'h evit an dud e prouadoù lenn ha kompren eus skol-veur Stanford. Drevezet e oa doare an dud da gompren ar gerioù hag ar frazennoù gant treterezh emgefreek al lavar naturel hag a-drugarez dezhañ e c'halle hiviziken ar patromoù deskoni emgefreek ober gant kementadoù bras a ditouroù a-raok reiñ respontoù resis d'ar goulennoù a saved gante[8].

En miz Du 2018, Google a roas lañs da BERT, ur patrom lavar[9].

E miz Mae 2020, OpenAI, un embregerezh savet gant Elon Musk ha Sam Altman, a roe lañs da GPT-3, ur patrom lavar dezhañ 175 miliard arventennoù skignet evel fork un API kenwerzh[10].

Damkanioù

Hentennoù

Levrlennadur

Liammoù diavaez

Pennadoù kar

Notennoù ha daveennoù