3.3 Hizkuntza konplexutasuna aztertzeko puntako HPa erabiliaz: CTAP

Oraingo honetan FLAIR bezalako tresna batekin egingo dugu probatxoa. CTAP tresnarekin, alegia. Konturatuko zinaten, FLAIR tresna probak egiteko oso erabilgarria dela, baina ez duela gordetzen ezer hurrengo saiorako. CTAP tresnak, ordea, zure corpusak gordetzen ditu, adierazgailu guztietatik nahi dituzunak aukeratu ditzakezu eta adierazgailu-multzoa gorde eta, bukatzeko, analisiak ere gorde ditzakezu. Aurrerago datuak modu ezberdinetan bistaratzeko. Oso tresna erabilgarria da eta sendoa: aukera asko ematen dituena. Gainera, hizkuntzen irakaskuntza aztertzeko erreferentzia bibliografikoetan aipatu diren ezaugarri gehienak aztertzen ditu eta hori egiteko punta-puntako hizkuntza-teknologia erabiltzen du.

Oraingoan ere proba bat egingo, baina oraingoa libreagoa izango da. Nahi baduzue corpus bera erabil dezakezue hirugarren jarduera hau egiteko:

Corpusa igo, adierazgailu batzuk aukeratu (asko ez, denbora itxaron beharko duzue eta), analisia osatu eta emaitzak aztertu CTAP tresnarekin.

Guk honela egin dugu:

  1. Testuak lehen zutabean daude, eta lerroetan testuen informazioa. Goian testu konplexuak jarri ditugu, behean sinpleak (hobeto ikusteko).
  2. Akeratu ditugun adierazgailuak goiburuan dituzue eta horien emaitzak azpian.

Text_title Lexical Richness: Type Token Ratio (Uber) Syntatic Complexity Feature: Complex T-unit Ratio
2-philosophy-C.txt 49.59 0.37
4-politics-C.txt 54.80 0.50
9-basque-C.txt 57.27 0.48
7-messi-C.txt 37.77 0.34
6-madonna-C.txt 46.27 0.42
1-philosophy_S.txt 33.19 0.79
3-politics-S.txt 35.75 0.79
10-basque-S.txt 45.85 0.30
5-madonna-S.txt 36.91 0.27
8-messi-S.txt 38.69 0.12

Taula honetan ikus dezakegu Wikipediako artikuluak bere bertsio sinplearekin konparatzen badugu, lexikoan aberatsagoak direla kasu guztietan. Baina aberastasun sintaktikoan, ordea, ez da gauza bera gertatzen. Zergatik? Erantzuna, Yasseri et al. (2012) lanean aurkituko duzu.

Erreferentzia:

  • Yasseri, T., Kornai, A., & Kertész, J. (2012). A practical approach to language complexity: a Wikipedia case study. PloS one, 7(11), e48386.