1.2 Corpusetan kontsultak eta bistaratzen tresnak: Lexikoaren Behatokian

Sarritan hizkuntzaren bat ikasten ari garenok, gauza bat zela nola idatzi behar den zalantza izaten dugu. Zalantza akademikoa bada eta ingelesezkoa, Google Scholarren begiratu genezake. Hizkuntza batetik bestera itzultzaileek nola itzuli duten jakin nahi badugu Linguee edo TextReference (euskarazko kontsultak egiteko). Baina corpus horietan hitzak soilik bila daitezke ezin da bilaketa konplexuagorik egin. Adibidez, ezin da bilatu "hori" eta ondoren aditz kategoriako edozein hitz.

Corpus erraldoietan bilaketa zehatz horiek egiteko, testuetako hitz guztiei ezin zaie etiketak jarri, gero bilaketak egiteko. Eta ez du merezi hain testu handiekin horretan jartzea pertsonak. Hori horrela, corpus erraldoi horietan modu automatikoan jartzen dira etiketa linguistikoa, ondoren bilaketa zehatzak egiteko. Etiketaren arabera errore tasa bat egongo da, baina erabiltzailea ohituta dago bilaketetatik behar duena hartzen. Beste kasu batzuetan, estatikoki jakiten da kasu batzuk ez direla ziurrak eta bilaketa estatistikoki ziurrak diren egituretan ere egin daiteke, Lexikoaren Behatokian, esaterako. 

Ataza honen helburua bilaketa konplexu batzuk egitea izango da. Lehenengo XXgarren jarduera honetan proposatzen zaizuen bilaketa egin dezakezu eta ondoren zeuok proposatu interesatzen zaizu bilaketa:

 Lexikoaren Behatokian modan jarri den esapide hau bilatuko dugu "balore eman"

Izan ere, jakin nahi dugu honako formak erabili diren eta noiztik hasi diren erabiltzen: "balorea eman", "balorerik eman", "baloreak eman", "balorean eman"...

Ariketa hau egiteko nik honako pausoak eman ditut:

  • Lexikoaren behatokian "joan bilaketa aurreratura" joan naiz (goian eskuma aldean).
  • Ondoren, aukera hauek erabili ditut: lehenengo lerroan: "ziurra", "lema", "da", "kategoria" eta bilaturiko hitza "balore". Bigarren lerroan: "1", "ondoren", "lema", "da", "kategoria" eta bilaturiko hitza "eman".

Hauek dira Lexikoaren Behatokian jaso ditugun emaitzak:


1.aren forma #
balorea 9
balorerik 4
balore 1
baloretzat 1
baloreek 1
estatistika
Taula horren arabera, "balorea eman" edo "balorerik eman" da maiztasun gehien erabiltzen diren formak, nahiz eta ez den asko erabilia izan. Eta Lexikoaren Behatokian 2011n erabiltzen hasi eta ondoren 2014tik maiztasunak gora egin du:
estatistika balore hitza

Corpusaren taimana eta maiztasunaren neurria izateko, beste egitura bat proba dezakezue, esaterako, "esku* eman". Kasu horretan agerpen kopurua 447 da.

Eta zuok daukazuen zalantza zein da? Zer bilaketa egin duzue?