Google (bilaketa motorra)

Googleren bilaketa-motorra (ingelesez: Google Search), normalean Google soilik, Alphabet Inc.-en webguneko bilatzailea da, egunero bere zerbitzuen bidez ehunka milioi kontsulta jasotzen dituena eta webean gehien erabiltzen den bilaketa motorra dena.[1] 1997an Larry Pagek, Sergey Brinek eta Scott Hassanek garatu zuten.[2] Googleren bilatzailearen helburu nagusia webguneetan, beste mota bateko datuak bilatu beharrean, testua bilatzea da.

 Google (bilaketa motorra)
Jatorria
Sortzailea(k)Larry Page eta Sergey Brin
Egilea(k)Sergey Brin eta Larry Page
Sorrera-urtea1997
Ezaugarriak
Hizkuntzaeleaniztuna
Programazio-lengoaiaC, C++ eta Python
Kokapena
JabeaGoogle
Historia
Jasotako sariak
BigBrotherAwards (en) Itzuli

google.com
Facebook: 104958162837 Twitter: searchliaison Youtube: UCWf2ZlNsCGDS89VBF_awNvA Edit the value on Wikidata

Googlen egin ditzakegun bilaketa estandarretatik aterata, Googlek gutxi gorabehera, 22 ezaugarri ezberdin eskaintzen ditu. Nahiz eta euskaraz ez diren guztiak eskaintzen, beste hizkuntza batzuetan, gaztelaniaz adibidez, ia guztiak ikus ditzakegu. Horien artean sinonimoak, aurreikuspen meteorologikoak, ordutegi-eremuak, burtsa-kotizazioak, mapak, lurrikarei buruzko datuak, ikuskizunen saila, aireportuetako informazioa eta kirol-emaitzak daude. Funtzio bereziak daude zenbakietarako, adibidez; zenbaki tarteak (70.. 73), prezioak, tenperaturak, unitateen eta txanponen bihurketak ("10,5 cm-tik m-tara"), kalkuluak ("3 * 4 + sqrt (6)-pi / 2"), paketeen jarraipena, patenteak, telefono-eremuko kodeak eta erakutsitako orrialdeen itzulpena.

Bilaketa emaitzen ordena (ghits Google hits bidez), Googleren emaitza-orrietan, neurri batean, "PageRank" izeneko lehentasun-tarte batean oinarritzen da. Googleren bilatzaileak aukera asko ematen ditu bilaketa pertsonalizatua egiteko, besteak beste, eragiketa boolearrak erabiliz: baztertzea ("-xx"), inklusioa ("+ xx"), alternatibak ("XX edo yy") eta komodina ("x* x").[3]

Bilaketa-terminoen erabilera-maiztasunak joera ekonomiko, sozial eta osasun gehiago adieraz ditzakeen bolumena lortu du. Googlen bilaketa-terminoen erabilera-maiztasunari buruzko datuek (Google Ads, Google Trendsen eta Google Insights for Search-en bidez eskuragarri) erakusten dute korrelazioa dagoela gripe-agerraldien eta langabezia-mailen artean, eta informazioa azkarrago ematen dute gobernuaren txostenak eta inkestak aurkezteko metodo tradizionalek baino.

2009ko maiatzaren 12an, Googlek iragarri zuen hCard, hReview eta hProduct mikro-formatuak aztertuko zituela "Rich snippets" deitu zuten bilaketa-emaitzen orriak handitzeko.

2011ko ekainean, Googlek "Google Voice Search" eta "Google Images" sartu zituen. Ezaugarri horiei esker, erabiltzaileek hitzak bilatzen dituzte hitz egitean eta irudiak sartzean.[4]

2011ko ekainaren amaieran, Googlek bere orrialde nagusiaren diseinua aldatu zuen tresna sozialen erabilera bultzatzeko asmoz. Publizitate, negozio bazkide eta enpresen informazio estekak nabigatzailearen beheko ertzera eraman ziren. Aldaketa nagusietako bat nabigazio klasikoko barra beltz batekin ordezkatzea izan zen. Chris Wiggins Googleko zuzendari sortzaile digitalak honako hau azaldu du: "Proiektu bat lantzen ari gara Googleren esperientzia berri eta hobetu bat emateko, eta datozen hilabeteetan gure itxuran aldaketa gehiago ikusten jarraituko dute".

Bilaketaren emaitza

Googlek aurkitzen dituen webgune guztien ehuneko zehatza kalkulatzea oso zaila da, ez delako ezagutzen. Googlek aurkibideak eta web-orrien cacheak bilatzeaz gain, "irudiak" ere hartzen ditu beste fitxategi mota batzuetatik, besteak beste, PDFtik, Word-eko dokumentuetatik, Excel kalkulu-orrietatik, Flash SWFtik, testu lauko fitxategietatik...[5]

"SafeSearch" teknologiaren bidez, erabiltzaileek bilaketa-motorra egokitu dezakete hizkuntza lehenetsia ezarriz, orrialde bakoitzean erakusten diren emaitzen kopurua iragaziz eta definituz.

Google kritikatu dute erabiltzaileen makinetan cookieak epe luzera jartzeagatik, haien lehentasunak gordetzeko. Taktika horrek erabiltzailearen bilaketa-baldintzak jarraitzeko eta datuak urtebete baino gehiagoz atxikitzeko aukera ematen die. Edozein kontsultatarako, lehen 1.000 emaitzetara arte erakuts dezake, orrialde bakoitzeko 100 gehienez. Emaitzen kopurua zehazteko aukera dago, baldin eta soilik baldin, "berehalako bilaketa" gaituta ez badago. "Berehalako bilaketa" aktibatuta badago, 10 emaitza soilik erakutsiko ditu.

Berehalako bilaketa

Google Instant-en erabilpena

Google Instant, erabiltzaileak idazten duen bitartean iradokitako emaitzak erakusten dituen hobekuntza, 2010eko irailaren 8an aurkeztu zen.[6] Kezketako bat da jendeak iradokitako emaitzetako bat aukeratzea, eskaera amaitu beharrean, praktika horrek partzialtasuna eragin diezaiekeela familia-enpresei edo beste bilaketa-termino batzuei. Termino pornografikoak eta beste termino iraingarri batzuk ez daude iradokitako emaitzetan. Bat-bateko funtzioa jatorrizko Google gunean eta iGoogle orri ez-espezializatuetan bakarrik agertzen da. Google Instanten bilaketak 2-5 segundo azkarragoak izatea espero du Googlek, eta, oro har, orduko 11.000.000 segundo izango liratekeela diote.[7]

Google Instant martxan jartzearekin batera, Googlek desgaitu egin zuen erabiltzaileek orrialde bakoitzeko 10 emaitza baino gehiago ikusteko aukera. Berehalako bilaketa menuko "lehentasunen" bidez desaktiba daiteke, baina bilaketa-iradokizunak automatikoki osatzeko estiloa ezin da jada desaktibatu. Google Instant bilatzeko metodo hori 2017an ezabatu zen, 7 urteko eraginkortasunaren ondoren.[8]

Harrera negatiboa

Erabiltzaile askok jakinarazi zuten, 2010etik aurrera, ez zirela gai izan berehalako bilaketa desaktibatzeko Googlen zituzten lehentasunetan. Azkenean, 2017an Google Instant desaktibatu zuten.

Zentsura

2600.com-ean egindako argitalpena: The Hacker Quarterly-ren argitalpenak Google Instantek mugatutako hitzen zerrenda bat bildu zuten, termino hauek Google Instanek ez ditu erakusten.[9][10] Termino gehienak, askotan, arruntak eta mespretxuzkoak dira berez, baina garrantzirik ez zuen bilaketa batzuk ere ezabatu ziren, hala nola, "Myleak".

Produktuen bilaketa

Webguneak bilatzeko zuen tresnaz gain, Googlek irudiak, albiste-taldeak, webguneetako albisteak, bideoak, herriak, mapak eta online saltzeko artikuluak bilatzeko zerbitzuak ere eskaintzen ditu. 2012an, Googlek 2.400 milloi erabiltzaile jaso zituen mundu mailan.[11]

Indexatzen duen edukiaren zati handi bat ere cachean ipintzen du.

Googlek beste tresna eta zerbitzu batzuk erabiltzen ditu, hala nola Google News, Google Suggest, Google Shopping, Google Maps, Google Co-op, Google Earth, Google Docs, Picasa, Panoramio, YouTube, Google Translate, Google Blog Search eta Google Desktop Search.

Googlen badira bilaketekin zuzenean lotuta ez dauden produktuak ere. Gmail, adibidez, webmail aplikazio bat da, baina bilaketa-funtzioak barne hartzen ditu. Google Browser Sync-ek ez du bilaketa erraztasunik eskaintzen, baina bere nabigazio denbora hobeto antolatzea du helburu.

Googlek betan dauden produktu asko ere baditu, hala nola Google Social Search edo Google Image Swirl.

Ezaugarri bereziak

Testua bilatzeko motorren funtzio nagusiaz gain, Googleren bilatzaileak, Gaztelaniaz, 22 "ezaugarri berezi" baino gehiago ditu (aktibatzeko dozenaka hitzetako edozeinek idaztean aktibatzen direnak) bilaketan. Euskaraz nahiz eta gutxiago izan gutxi batzuk ere badaude:[12]

Eguraldia gako-hitza bilatzean.
Eguraldia: baldintza klimatikoak, tenperatura, haizea, hezetasuna eta pronostikoa, hiri askotarako, "eguraldia" idazten ikus daiteke, hiri handietarako hiri batekin edo hiri eta estatuarekin batera, (adibidez: Bilboko eguraldia, Pariseko eguraldia, Bermeoko eguraldia).[13]
Merkatu laburpenak: Enpresa zehatz edo funts baterako merkatuko datuak ikus daitezke, ikurra idatzita (edo "akzioak" sartuta), hala nola: CSCO; MSFT; IBMren akzioak; F akzioak (Ford Motor Co.), edo AIVSX (funtsa). Horretaz gain, bilatzen dituzun kriptomoneten merkatu-laburpena ikus dezakegu, hala nola: Ethereum (ETH), Bitcoin (BTC), Dogecoin (DOGE), adibidez. Emaitzek egunez egun aldaketak erakusten dituzte, edo 5 urteko grafiko bat.[14]
Ordua: Egungo ordua eman dezake, hiri askotako ordua (mundu osoan). Euskarazko bilatzailean bila daiteke, baina bilatu ahal izateko gaztelaniaz bilatu behar da, "hora Madrid". Eta ikus dezakegunez, ematen duen informazioa euskaraz dago, hala ere, ez du funtzionatzen "Madrilgo ordua" euskaraz jartzen badugu.
Hegaldiak: Nahi duzun aireportutik nahi duzun helmugaraino hegaldia bilatzen lagunduko dizu. Funtzio honek hegaldi merkeenak bilatzen ditu, aire-konpainia desberdinekin alderatuz.[15]
Moneta bihurketa: Diru edo moneta bihurgailu bat hauta daiteke, moneta izenak edo kodeak idatziz (ISO 4217 arauan zerrendatzen direnak): 6.789 euro USDn, 150 libera esterlina dolarretan, 5.000 yen dolarretan, 5.000 yuan liran (AEBtako dolarra USDkoa izan daiteke, edo "US $" edo "$", kanadarra CAD den bitartean, eta abar).[16]
Kalkulagailua: Emaitzen kalkulua, zuzeneko kalkuluen arabera, zenbaki- edo hitz-formula bat sartuz zehaztu daiteke, adibidez: 6* 77 + pi + sqrt (e^3)/888 gehi 0,45. Erabiltzaileak kalkuluaren ondoren formularen bidez bilatzeko aukera du. Kalkulagailuak unitatea eta dibisen bihurketa-funtzioak ere erabiltzen ditu unitate-kalkuluak egiteko. Adibidez, "(3 euro/litro)/(40 milia/galoi) milia USDn", kalkulatu zenbat balio duen milia bakoitzeko 40 miliako auto batek litroko 3 euro balio duen gasolina-galoi bakoitzeko. Halaber, ehunekoak onargarriak dira ("300en % 40"). Eztabaida batzuk daude Googleren kalkuluari dagokionez (0^0). Matematikari askok uste dute 0^0 ez dagoela definituta, baina Googleren kalkulagailuak 1 bezala erakusten du emaitza.[17]
Bilaketa-hiztegia: Hitz edo esaldi baten definizioa "definitu" sarreraren eta bi punturen eta bilaketa-hitzen bidez aurki daiteke (adibidez, "definitu: filosofia"). Hala ere, definizioa ez du euskaraz ematen, gaztelaniaz baizik.[18]
Mapak: Mapa batzuk erakutsi dezake, soilik izena edo posta-kodea sartuz. Adibidez, EE.UU eta "mapa" hitza (hala nola: Japonia mapa, Kansasko mapa[19] edo Parisko mapa).
Zinema-karteldegia: Iruzkinak edo filmen ordutegiak zineman dagoen edozein pelikularen zerrendak izan daitezke, "filmak" idazten baditu edo film baten izena bilaketa-koadroan. Hemen, egungo nahiz antzinako filmen gomendio bat ikusiko dugu, haien generoaren arabera.[20]
Kokapenak: Honekin negozio bat non kokatzen den aurki dezakegu, mapa baten bidez, negozio horren telefonoa, kokapen zehatza eta ordutegia erakusten dizkigu.
Area kodea: Kokapen geografikoa 5 digituko area kodea idatziz erakuts daiteke (adibidez: 20018).[21]
Itzultzailea: Googleren itzultzailearen bertsio txikia.

Bilaketa zifratua

2010eko maiatzean, Googlek web bilaketarako SSL zifratze-sistema abiarazi zuen.[22] Bilaketa zifratua encrypted.google.com bidez sar daiteke.

Google Barden sarrera

Sundar Pichai, CEO, Google

2023ko otsailaren 6an, Sundar Pichaik iragarri zuen bilaketa-motorrak chatbot bat integratuko zuela bilaketa-emaitzetan.[23]

Googleren beraren hitzetan, CEOk idatzitako post baten bidez, Sundar Pichai:

"Laster, Bilaketan AAn oinarritutako funtzioak ikusiko dituzu, digeritzeko errazak diren formatuetan informazio konplexua eta perspektiba anitzak azaleratzen dituztenak, panorama orokorra azkar ulertu eta webgunetik gehiago ikasi ahal izateko: ikuspegi gehigarriak bilatuz, pianoa eta gitarra jotzen duten pertsonen blogak adibidez, edo erlazionatutako gai batean sakonduz, hala nola hasiberri gisa hasteko urratsak. AAren funtzio berri horiek laster hasiko dira erabiltzen Googleren Bilaketan. "[24]

Google MAGI

Google Magiren sarrera

Googlek "Magi" merkaturatuko duela iragarri du, adimen artifizialarekin funtzionatuko duen eta Bing eta ChatGPT chatbotak eskaintzen duenarekin lehiatzea bilatuko duen bilaketa-motorra. Iragarpen horren ondoren, ez da ezagutzen Google Barden norabidea, Magik agintzen dituen funtzio zehatzak betetzeko sortu zela zirudien tresna. Planifikatuta bazuten ere, badirudi azkartu egin dutela iragarpena, bere nagusitasuna arriskuan ikusi ondoren. Samsung Google Bing bidez ordezkatzea bere gailuetan bilaketa-motor lehenetsi gisa hartzen ari zela esaten da. Horrek izua eragin zuen Googlen, The New York times-en filtratutako barne-mezuak.[25]

Googlek oraindik ez du Magi proiektuari buruzko informazio ofizialik partekatu; hala ere, enpresa teknologikoaren bozeramaile Lara Levinek bilatzailearen funtzio berrietarako AAri ematen ari zaizkion garrantzia azpimarratu du.[26]

"[...] Oso pozik gaude IAk bultzatutako funtzio berriak bilaketara ekartzeko, eta laster xehetasun gehiago partekatuko ditugu ".Lara Levin, Googleko bozeramailea.

Google Estatu Batuetan bakarrik hasiko da ezartzen milioi bat pertsonari gehienez, eta 30 milioira haziko da urte amaierarako, aurreikusitako plangintzaren arabera. Oraindik ez dago data zehatzik Magi proiektua publiko orokorrarentzat ateratzeko.[26]

Ezaugarriak

Google bilaketa-motorra

Google bilatzailea hainbat web-orriko egitura batean oinarritzen da. Hauen artean handiena: google.com, munduko webgune bisitatuenetakoa izanik.[27] Bilaketa bat egiterakoan ikus dezakegu esteka bat itzultzen dituela bilaketan ezarri den hitzekin. Itzultzen den estekan hiztegiko hitzak, haren bilaketan lortu zituen emaitzen kopurua, beste bilaketa batzuetarako estekak (adibidez, Googlek uste du hitz horiek okerrak direla, erabiltzaileari esteka bat ematen dio bilaketa-emaitzetarako, Google-k proposatutako ortografia erabiliz), eta beste gauza asko itzultzen dizkigu.

Google +1

Google +1ek eduki garrantzitsuak aurkitzen laguntzen die pertsonei, eta helburua Googleren bilaketa-emaitzak handitzea da, pertsonei orria fidagarria den ala ez erakusteko egoera bat eskainiz. Googleren erabiltzaile batek Googleren bilaketa-emaitzak erabiltzen dituenean, +1 botoi bat erakutsiko du orria gomendatzeko, eta ohar bat bere orrialdea gomendatu duten erabiltzaileen konexioen izenekin. [28][29] Ala ere gaur egun (2023-an) hau ez dago eskuragarri eta Google-k berak algoritmo baten bidez ordenatzen ditu web-orriak. [30][31]

Interfazearen ezaugarriak

  • Atzealde zuri eta erraza, hau aldatzeko aukerarekin ezarpenak erabiliz gai ilunera.[32] Izenburuan noizean behin aldaketak izaten dituena, aldaketa hauek esanahi historikoa duten egunetan edo egun jakinetan gertatzen dira.[33]
  • Goiko barrak honako hauek ditu: Irudiak, bideoak, erosketak, maps, liburuak, iragarkiak, hegaldiak, finantzak...[34]
  • Ahotsaren araberako bilaketak idazten baino bilaketa azkarragoa ahalbidetzen du, edo idazkera zuzena ezagutzen ez bada. [35]
  • Irudi bidezko bilaketa egiteko aukera dugu, igotako irudiaren antzeko irudiak edo irudi hau erabiltzen duten web-orriak itzuliz. [36]
  • Googleko kontua erabiltzen duzunean, bilaketa-historia automatikoki erregistratzen da. [37]
  • Googleren bilatzailearen tipografia Product Sans da, zerotik sortutakoa testu gehienekin konbinatzeko eta hau denentzat ulergarria izateko.[38]
  • Google Instant, bilaketa bat osatzean ahalik eta azkarren lortu nahi dugun erantzuna lortzen laguntzen digu. Adibidez, hitz bat gaizki idazten baduzu honen zuzenketa itzultzen dizu. [39]

Google bomb

Artikulu nagusia: «Google bomb»

Merkatuan duen lidergo-posizio garrantzitsuaren ondorioz, Google bilatzaileen aurkako spam deritzonaren helburu nagusia da. Zentzu horretan, lehen emaitzen artean ahalik eta bilaketa-hitz gehien kokatzen saiatzen gara. Gako-hitz horiek, askotan, ez dute inolako loturarik orrialdeen benetako edukiarekin. Hainbat teknika erabiltzen dira, hala nola Doorway-page, Farm-Links edo Page-Cloacking.

Aukera hori lehen aldiz egiaztatu zen George W. Bush Estatu Batuetako presidenteari zuzendutako Google-bomba bati buruzko iritzi publikoaren arabera. Bilaketa hitza "miserable failure" (euskaraz: "porrot miserable") Bushen aurkariek orri ofizialera lotu zuten Bushen biografiarekin Etxe Zurian.[40]

Ordainetan, Bushen aldekoek gauza bera egiten saiatu ziren Michael Mooreren aurka (Fahrenheit 9/11 dokumentalaren zuzendaria). Une horretatik aurrera, lehenengo postuak sarri aldatzen dira bien artean.

Google-ko webgunearen ranking-aren manipulazioak Google-Spamming kontsideratzen dira. Hau saihesteko google-ek maiz aldatzen du algoritmoa.

Logotipoa (Doodle)

Artikulu nagusia: «Google-eko Logoa»

Batzuetan, Googleren web-orriko logotipoa bertsio berezi batera aldatuko da, "Google Doodle" izenekora. Doodle sakatzean, erabiltzailea gaiari buruzko Googleren bilaketa-emaitzen kate batera eramango du. Lehena Burning Man Jaialdiari buruzko erreferentzia izan zen 1998[41][42]an, eta beste batzuk Albert Einstein bezalako pertsona ospetsuen urtebetetzerako ekoitziak izan dira, gertaera historikoak, hala nola Legoko blokearen 50. urteurrena, San Valentin Eguna edo bilaketa egiten den herrialdeko ekitaldiak.[33]

Energia kontsumoa

Googlek dio 0,0003kWh energia gastatzen duela batez besteko bilaketa-kontsultan, gutxi gorabehera 0,2g karbono dioxidora bihurtuz. [43]

Googleren optimizazioa

Artikulu nagusia: «Web posizionamendu»

Google bilatzailerik ezagunena denez, webmaster askok eragina izan nahi dute Google-n duten webgunearen sailkapenean. Aholkularitza-industria bat webguneei Googlen eta beste bilatzaile batzuetan sailkapena handitzen laguntzeko sortu da. Eremu hau, bilaketa-motorren optimizazioa (SEO ingelesez) deitua, bilaketa-motorren zerrendetan patroiak bereizten saiatzen da, eta, ondoren, sailkapena hobetzeko eta bezeroen guneetara erabiltzaile gehiago erakartzeko metodologia bat garatzen.

Bilaketa-motorren optimizazioak hainbat faktore hartzen ditu barnean, hala nola orrialdeko faktoreak (testuaren gorputza, izenburuaren elementuak, izenburuaren elementuak eta alt atributuaren balioen irudia) nola orrialdetik kanpoko optimizazio-faktoreak (ainguraketa-testu gisa eta PageRank gisa). Googleren garrantzizko algoritmoaren arabera jokatzea da ideia orokorra, orrian gako-hitzak txertatuz, bereziki izenburua eta testuaren gorputza (oharra: zenbat eta gorago egon orrialdean, orduan eta aukera handiagoak izango dira gako-hitzak ikusteko eta, beraz, sailkapen altua izango dute). Hala ere, gako-hitzaren errepikapen gehiegik bilaketa-orria susmagarria egiten du Googleren spam prebentzio-algoritmoarentzat.

Google-k gida bat argitaratu du optimizazio-aholkulari legitimoen erabileran sailkapena hobetu nahi duten webguneen jabeentzat.[44]

Sistema banatua

Banatutako sistema bat banatutako komunikazio-sare baten bidez fisikoki bereizitako eta elkarren artean konektatutako konputagailu-multzo bat da. Google erabiltzen den sistema banatu konplexuenetako bat da. Azpiegitura horrek hainbat baldintza bete ditu, hala nola eskalagarritasuna, errendimendua, fidagarritasuna eta izaera irekia.

Eskalagarritasuna: Googlek eskalagarritasuna hobetu behar du, hainbat azpisistemarekin banatutako sistema baita, milioika erabiltzaileri zerbitzua emanez. Eskalagarritasun-arazoak ditu dimentsio hauetan:

  • Gero eta datu gehiago behar ditu.
  • Eskaera gehiago egitea erabiltzaileen hazkundeari aurre egiteko.
  • Bilatu emaitza hobeak.

Fidagarritasuna: sistemak uneoro funtzionatu behar du, batez ere 24 orduz erabilgarri egon behar duen bilaketa-funtzionaltasuna. Googlek % 99,9ko zerbitzu-mailako akordioa eskaintzen du.

Errendimendua: sistemaren errendimendu orokorra kritikoa da Googlerentzat, bereziki erabiltzaileen interakzioetan latentzia baxua lortzeko. Errendimendua zenbat eta hobea izan, orduan eta aukera gehiago erabiltzaileak berriro bilaketa gehiago egiteko.

Gardentasuna: gardentasun-premia handia dago aplikazio berrien garapenari eta web zerbitzuaren hedagarritasunari eusteko.

Bilaketa-motorraren alderdiak

Miaketa (crawling)

Crawler baten zeregina Webeko edukiak aurkitzea eta lortzea da, eta edukia indexatzeko azpisistemetara pasatzea. Horretarako, Googlebot softwarea erabiltzen da, zeinak, baliabide gisa, emandako web-orri bat irakurtzen duen, estekak lortuz eta arakatze-eragiketa berriak planifikatuz. Bisiten maiztasuna orrialdea zenbat aldatzen den araberakoa da.

Google Caffeine: 2009ko abuztuan, Googlek "kafeina" izeneko bilaketa-arkitektura berria merkaturatu zuela iragarri zuen. Arkitektura berria diseinatu zen emaitzak azkarrago lortzeko eta hobeto funtzionatzeko Facebook eta Twitter bezalako zerbitzuen etengabeko informazio eguneratuarekin. Googleren garatzaileek adierazi zuten erabiltzaile gehienek ez zutela berehalako aldaketarik nabarituko, baina garatzaileak gonbidatu zituzten beren bilaketa-motor berria modu isolatuan probatzera, programa babesteko. Bilaketa-motorraren optimizazioan duen eraginagatik nabaritzen diren ezberdintasunek gako-hitzen haztapen handiagoa dute, eta kontuan hartzen ditu menderatzeak dituen urteak. Neurri hori Microsoften bilaketa-zerbitzu baten bertsio hobetua merkaturatzeko erantzun gisa interpretatu zuten batzuek, eta Bing izena eman zioten. Googlek 2010eko ekainaren 8an iragarri zuen "kafeina" amaituko zela, bere indizearen etengabeko eguneratzearen ondorioz % 50 emaitza berriagoak zituztela adieraziz. "Kafeinarekin", Googlek bere back-end indexazio plataforma aldatu zuen MapReduce a BigTable. "Kafeina" ere Coloso edo GFS2, EFP fitxategiak banatzeko sistemaren erreforma batean oinarritzen da. 2010ean Caffeine sartu zenean, Google etengabeko hurbilketa batera igaro zen, bilaketa-emaitzetan freskotasun handiagoa eskaintzeko asmoz. Caffeinek Percolator izeneko azpiegitura-zerbitzu berri bat erabiltzen du, datu-multzo handien eguneratze inkrementala onartzen duena.
Google Hummingbird: 2013ko irailean Googlek Google Hummingbird edo Google Colibrí merkaturatu zuen, Google Caffeine ordezkatuko duen algoritmo berria, zeinaren berrikuntza nagusiak galderei erantzuteko aukeran oinarritzen diren, hitz bakoitza bereizita interpretatu beharrean. Googlerentzat hori beste aurrerapauso bat da bilatzaile adimendunerantz. Google Colibrík ez luke eragin zuzenik izango penalizazioetan; aitzitik, garapenean aurrera egitea izango litzateke, Google Panda edo Google Penguin bezalako beste aldaketa batzuek spam-aren aurka borrokatzeko elementuak sartu dituztela kontuan hartu gabe.

Indexazioa

Liburu baten antzeko edukien aurkibidea sortzen du. Teknikoki, web-orrietan agertzen diren hitzen alderantzizko indexatzea eta beste testu-baliabide batzuk esaten zaio, hala nola, .pdf, .doc dokumentuak eta beste formatu batzuk. Posizioa gordetzeaz gain, beste informazio garrantzitsu bat ere gordetzen du, hala nola, iturriaren tamaina eta kapitalizazioa. Aurkibide hori erabiliz, milaka milioitik hamarnaka milara murrizten da hautagai-orrien kopurua, bilatutako hitzen botere diskriminatzailearen arabera.

Indexazioak esteken aurkibidea ere mantentzen du, web-orri bat zein orritan kokatzen den ikusteko jarraipena eginez.

Indexagarriak ez diren datuak: Bere indize izugarria izan arren, online datu-baseetan ere badago informazio kopuru handi bat kontsulten bidez eskura daitekeena, baina ez esteken bidez. "Internet sakona" edo "Internet ikusezina" Googlek eta beste bilatzaile batzuek estaltzen dute, gutxienez. Internet sakonak liburutegien katalogoak, gobernuen legegintzako dokumentu ofizialak, telefono-gidak eta kontsulta bati erantzuteko dinamikoki prestatuta dauden beste eduki batzuk ditu.
Google-k bilaketaren emaitzak ordenatzen ditu bere PageRank algoritmoa erabiliz. Web-orri bakoitzari zenbaki bat esleitzen zaio, beste orrialde batzuetako esteka-kopuruaren, orrialde horien balioaren eta publikoak ez diren beste irizpide batzuen arabera,

Sailkapena, Google Ranking

"Googleren ranking" terminoa bilaketa-emaitzetan webgune edo webgune espezifiko bat agertzen den posizioari dagokio, norbaitek Google kontsulta jakin bat bilatzeko erabiltzen duenean. Bilaketa-motorretarako (SEO, ingelesezko siglen arabera) optimizazioaren helburua Googleko webgune baten eta beste bilatzaile batzuen rankinga hobetzea izaten da.

Informazio asko izanda, ia ezinezkoa litzateke bilatzen duzuna laguntza pixka batekin gabe aurkitzea. Googleren rankinga, hain zuzen ere, honetarako diseinatu da: ehunka mila milioi webguneren eta bilaketaren indizearen beste eduki baten artean bilatzea, emaitza baliagarrienak eta garrantzitsuenak segundo pare batzuetan azaltzeko, eta modu horretan, bilatzen duzuna aurkitu ahal izateko.

Hainbat faktorek eragiten dute Googleren rankingean, eta bilaketa-motorraren algoritmoak etengabeko bilakaeran daude. Informazio erabilgarriena eskaini ahal izateko, bilaketa-algoritmoek faktore eta seinale asko hartzen dituzte kontuan, zure bilaketaren hitzak, orrialdeen garrantzia eta erabilgarritasuna, iturrien espezializazio-maila, kokapena eta konfigurazioa. Faktore bakoitzari ematen zaion garrantzia aldatu egiten da zure bilaketaren izaeraren arabera. Adibidez, edukiaren gaurkotasunak garrantzi handiagoa du gaurkotasuneko albisteei buruzko kontsultetan hiztegiko definizioei buruzko kontsultetan baino.[45]

Googlen webgune baten rankingean eragina izan dezaketen funtsezko faktore batzuk honako hauek dira:

  • Edukiaren garrantzia: Googleren helburua erabiltzaileei beren kontsultetarako edukirik garrantzitsuena eta erabilgarriena ematea da. Eduki garrantzitsua eta kalitate handikoa duten webguneek aukera gehiago dituzte ondo sailkatzeko.
  • Gako-hitzak: Edukian garrantzitsuak diren; gako-hitzak, izenburuak, xede-deskribapenak eta beste elementu batzuk erabiltzea funtsezkoa da SEOrako. Hala ere, gako-hitzak betetzeak (gako-hitzaz gehiegi eta garrantzirik gabe erabiltzeak) eragin negatiboa izan dezake.

Bilaketak Googleren kontuaren jardueraren arabera emaitzak pertsonalizatzeko aukera ematen duten funtzio batzuk ditu. Adibidez, "hurbileko gertaerak" bilatzen badituzu, baliteke gomendio batzuk egokitzea interesgarriak izan daitezkeen gertaeren kategoriak erakusteko.

Sistema horiek zure interesekin bat etortzeko diseinatuta daude, baina ez dute ezaugarri sentikorrik ondorioztatzen, hala nola zure arraza, erlijioa edo alderdi politikoa.[45]

Middleware

Artikulu nagusia: «Middleware»

Sistema garatzaileei funtzionaltasuna eskaintzen dieten zerbitzu banatuen talde batek osatzen du. Honako kategoria hauetan banatuta daude:

Komunikazio-paradigmak, urruneko zein multicast komunikazioetarako zerbitzuak barne.

  • Bufferra: serializazio-formatu komuna eskaintzen dute.
  • Publish-subscribe: ekitaldiak barreiatzeko zerbitzua.

Datuak eta koordinazioa, biltegiratzea eta datuetarako sarbide koordinatua ematen du.

  • GFS: Googleren beharretarako optimizatutako fitxategi-sistema bat eskaintzen du, tamaina handiko fitxategiak biltegiratzea barne.
  • Chubby giltzarrapo-zerbitzua: zerbitzuen koordinazioa eta datu-bolumen txikien biltegiratzea jasaten ditu.
  • Bigtable: GFS/Chubby gainean eraikitako datu-base banatua.

Konputazio banatua, arkitektura fisikoaren gaineko konputazio paraleloa eta banatua erabiltzeko zerbitzuak ematen ditu.

  • MapReduce: datu-multzo handien gainean banatutako konputazioari eusten dio.
  • Sawzall: konputazio banatuak exekutatzeko maila handiko lengoaia bat da.[46]

Google-en Algoritmoa

Googleren algoritmoak sistema konplexu bat dira, bere bilaketa-indizeko datuak berreskuratzeko eta berehala kontsulta baterako ahalik eta emaitzarik onenak emateko erabiltzen dena. Bilatzaileak algoritmoen eta sailkapen-faktore ugariren konbinazioa erabiltzen du web-orriak garrantziaren arabera sailkatuta entregatzeko bilatzailearen emaitza-orrietan (SERP).

Bere lehen urteetan, Googlek bere algoritmoen eguneratze batzuk baino ez zituen egin. Gaur egun, Googlek milaka aldaketa egiten ditu urtero.

Eguneratze horietako gehienak hain dira arinak, ezen oharkabean pasatzen baitira. Hala ere, batzuetan, bilatzaileak eguneratze algoritmiko handiak egiten ditu eta horrek eragin handia du bilatzailearen emaitzetan.[47]

Informazio erabilgarriena eman ahal izateko, Bilaketako algoritmoek faktore eta seinale asko hartzen dituzte kontuan, hala nola zure kontsultako hitzak, orrien garrantzia eta erabilgarritasuna, iturrien espezializazio-maila, kokapena eta konfigurazioa. Faktore bakoitzari ematen zaion pisua aldatu egiten da zure kontsultaren izaeraren arabera. Adibidez, edukiaren datak garrantzi handiagoa du gaurkotasuneko albisteei buruzko kontsultei erantzutean hiztegi batean ager daitezkeen definizioei buruzko kontsultetan baino.[48]

Bilaketaren indizearen zatirik handiena arakatzaile izeneko software mota baten bidez sortzen da. Software horrek automatikoki bisitatzen ditu web-orri publikoak eta bertan dauden estekak jarraitzen ditu, pertsona batek webean edukia kontsultatuko baluke bezala. Arakatzaileak orrialde batetik bestera doaz, eta bertan eta Googleren Bilaketaren aurkibidearen beste eduki publiko batean aurkitzen duten informazioa gordetzen dute. [49]

Arakatzaileek web-orri bat aurkitzen dutenean, gure sistemek nabigatzaile batek bezala prozesatzen dute edukia; funtsezko adierazleak hartzen ditugu erreferentziatzat (gako-hitzetatik eguneratze-tasaraino) eta datu horien guztien jarraipena egiten dugu Bilaketaren indizean. Googleren Bilaketaren indizeak ehunka mila milioi web-orri ditu, elkarrekin, 100.000.000 gigabyte baino gehiago dituztenak. Indexatzen dugun web-orri bakoitzeko hitz bakoitzerako sarrera bat du.[49]

Webgunearen eta beste iturri batzuen edukia etengabe aldatzen denez, miaketa-prozesuak beti daude aktibo informazio eguneratuena lortzeko. Dagoeneko eskuratu duten edukia aldatzeko maiztasuna detektatzen dute, eta, beharrezkoa bada, berriro arakatzen dute. Halaber, eduki berria deskubritzen dute orri hauetara edo informazio honetara zuzendutako esteka berriak agertzen direnean. Googlek ez ditu ordainketak onartzen webgune bat maizago arakatzeagatik.[49]

Errore-mezuak

Google, 403 Forbidden errorea

Bilaketa batzuek "403 Forbidden error" errorea emango dute. Batzuetan, CAPTCHA sistema baten atzetik.[50]

403 Forbidden errorea HTTP egoera-kodea da, eta eskatzen den orrirako edo domeinurako sarbidea mugatuta dagoela adierazten du. Mezu horrek esan nahi du web zerbitzariak eskaera ulertzen duela, baina erabiltzaileak ez duela eskatutako baliabidera sartzen uzten, ez segurtasun-murrizketengatik, ez baimenengatik.[51]

Pantailaren berri, lehen aldiz, 2005ean eman zen, eta bilaketak optimizatzeko enpresek Googleren erabilera handiari emandako erantzuna izan zen, optimizatzen dituen guneen heina egiaztatzeko. Mezua eskaera kopuru handi batek eragiten du, IP helbide bakar batetik abiatuta. Googlek, antza, cookie-ak erabiltzen ditu bere protokoloaren zati gisa zerbitzua baztertzen duen ala ez erabakitzeko.

2009ko ekainean, Michael Jackson pop izarra hil ondoren, mezu hori agertu zitzaien Googlen abeslariarekin lotutako albisteak bilatzen ari ziren Interneteko erabiltzaile askori, eta Googlek onartu zuen DDoS eraso bat izan zela, nahiz eta galdera asko bilatzaile legitimoek aurkeztu zituzten.

2009ko urtarrilean Software-errorea

Googlek bilaketa-emaitzak etiketatzen ditu "Gune honek zure ekipoa kaltetu dezake" mezuarekin, gunea software maltzurra instalatzeagatik ezaguna bada. Googlek horrelako webguneak bisitatzen dituzten erabiltzaileak babesteko egiten du hori. 40 minutu inguru 2009ko urtarrilaren 31n, bilaketen emaitza guztiak gaizki sailkatu ziren malware gisa eta, beraz, ezin zen bertan klik egin. Horren ordez, erabiltzaileari abisua emateko mezu bat agertzen zen, eta erabiltzaileak eskuz eskatutako URL helbidea sartzeko eskatzen zitzaion. Arazo hau giza errore batek eragin zuen.[52][53] Malware-patroien fitxategian akats baten ondorioz gehitu zen "/" (URL guztietara hedatzen dena) URL helbidea.

Internazionala

Google bilaketa hizkuntza askotan dago eskuragarri, eta eraldatua izan da herrialde askotarako. Guztira 144 hizkuntzetan bistaratu dezakegu eta 46-etan hizkuntza iragazketa ezarri, bilaketaren emaitzak hizkuntza horretan besterik ez agertzeko. Ondorengoak dira Googleren bilatzaileak onartzen dituen hizkuntza guztiak:[54]

Hizkuntzak

Wikipediaren kodeaHizkuntza euskarazHizkuntza Google
bilaketan nola adierazi
Hizkuntza Iragazketa ezarri (bai/ez)
achAcholiAcoliez
afAfrikaansAfrikaansbai
akAkaneraAkanez
amAmhareraአማርኛez
arArabieraالعربيةbai
azAzerbaijaneraazərbaycanez
banBalineseBalineseez
beBielorrusieraБеларускаяbai
bemBembaIchiBembaez
bgBulgarieraБългарскиbai
bnBengaleraবাংলাez
brBretainieraBrezhonegez
bsBosnieraBosanskiez
caKatalanCatalàbai
cebCebueraCebuanoez
chrTxerokieraᏣᎳᎩez
cnrMontenegroerasrpski (Crna Gora) ez
coKorsikeraCorsicanez
crsSeychelleetako_kreoleraSeychellois Creoleez
csTxekieračeštinabai
cyGalesCymraegez
daDanieraDanskbai
deAlemanDeutschbai
eeEweeraÈʋegbeez
elGrezieraΕλληνικάbai
enIngelesEnglishbai
eoEsperantoEsperantobai
esGaztelaniaEspañolbai
esGaztelania latinoamerikarraEspañol (latinoamerica)ez
etEstonieraEestibai
euEuskaraEuskaraez
faPersieraفارسیbai
fiFinlandieraSuomibai
foFaroeraføroysktez
frFrantsesFrançaisbai
gaIrlandako gaelera/IrlanderaGaeilgeez
gaaGaGaez
gdEskoziako gaeleraGàidhligez
glGalizieraGalegoez
gnGuaranieraAvañe'ẽez
guGujarateraગુજરાતીez
haHausaHausaez
hawHawaiieraʻŌlelo Hawaiʻiez
heHebreeraעבריתbai
hiHindiहिन्दीbai
hrKroazieraHrvatskibai
htHaitiko kreoleracréole haïtienez
huHungarieraMagyarbai
hyArmenieraՀայերենbai
iaInterlinguaInterlinguaez
idIndonesieraIndonesiabai
igIgboeraIgboez
isIslandieraÍslenskabai
itItalieraItalianobai
jaJaponiera日本語bai
jvJaveraJawaez
kaGeorgieraქართულიez
kgKikongoKongoez
kkKazakheraқазақ тіліez
kmKhmereraខ្មែរ ez
knKannadaಕನ್ನಡez
koKoreera한국어bai
kriSierra Leoneko KrioleraKrioez
kuSoraniko Kurdoaکوردیی ناوەندیez
kyKirgizeraКыргызчаez
laLatinLatinez
lgLuganderaLugandaez
lnLingalaLingálaez
loLaoseraລາວez
lozLoziLoziez
ltLituanieraLietuviųbai
luaLuba-LuluaLuba-Luluaez
lvLetonieraLatviešubai
mfeMauriziar kreolerakreol morisienez
mgMalgaxemalagasyez
miMaorieraMāoriez
mkMazedonieraМакедонскиez
mlMalaberaമലയാളംez
mnMongolieraМонголez
mrMaratheraमराठीez
msMalaysieraMelayuez
mtMalteraMaltiez
myBirmanieraမြန်မာez
neNepaleraनेपालीez
nlNederlanderaNederlandsbai
nnNynorskNorsk nynorskez
noNorvegieraNorskbai
nsoPedieraNorthern Sothoez
nyTxeweraNyanjaez
nynRunyankoreRunyankoreez
ocOkzitanieraOccitanez
omOromoeraOromooez
orOriyaଓଡ଼ିଆez
paPunjaberaਪੰਜਾਬੀez
pcmNigeriako PidgineraNigerian Pidginez
plPolonieraPolskibai
psPaxtuneraپښتوez
ptPortuges(Brasil)Português (Brasil)ez
ptPortuges(Portugal)Português (Portugal)bai
quKitxuaRunasimiez
rmErromantxerumantschez
rnKirundiIkirundiez
roErrumanieraRomânăbai
ruErrusieraРусскийbai
rwKinyaruandaKinyarwandaez
sdSindhiسنڌيez
siSinhalaසිංහලez
skEslovakieraSlovenčinabai
slEslovenieraSlovenščinabai
snShonachiShonaez
soSomalieraSoomaaliez
sqAlbanieraShqipez
srSerbieraсрпскиbai
srSerbiera alfabeto latinoanSrpski (latinika)ez
stSothoeraSouthern Sothoez
stqMendebaldeko frisieraFryskez
suSunderaBasa Sundaez
svSuedieraSvenskabai
swSwahiliKiswahilibai
taTamileraதமிழ்ez
teTeluguతెలుగుez
tgTajikeraТоҷикӣez
thThailandieraไทยbai
tiTigrinyeraትግርኛez
tkTurkmeneraTürkmen diliez
tlFilipineraTagalobai
tnTswaneraTswanaez
toTongeralea fakatongaez
trTurkieraTürkçebai
ttTatareraтатарez
tumTumbuka hizkuntzaTumbukaez
twTwiTwiez
ugUigurreraئۇيغۇرچەez
ukUkranieraУкраїнськаbai
urUrdueraاردوez
uzUzbekeraO'zbekez
viViatnamiteraTiếng Việtbai
woWoloferaWolofez
xhXhosaisiXhosaez
yiYiddishייִדישez
yoJoruberaÈdè Yorùbáez
zhTxinera (Txina)中文 (简体)bai
zhTxinera (Taiwan)中文 (繁體)bai
zuZulueraisiZuluez

Google-ren hizkuntza lehenespenekin kezka aipa daiteke: https://www.argia.eus/albistea/googleren-hizkuntza-lehenespenekin-kezka

Domeinu izenak

Artikulu nagusia: «Zerrenda:Googlen domeinuak»

Google-ek gainera 165 herrialde eta 21 dependentzietako domeinu ezberdinak ditu propietate gisa. Hauek denek batuta 187 domeinu egiten dute. [55] Baina honek duen domeinu nagusia Google.com da.

Erreferentziak

Ikus, gainera

Kanpo estekak