3.3 Hizkuntza konplexutasuna aztertzeko puntako HPa erabiliaz: CTAP
Oraingo honetan FLAIR bezalako tresna batekin egingo dugu probatxoa. CTAP tresnarekin, alegia. Konturatuko zinaten, FLAIR tresna probak egiteko oso erabilgarria dela, baina ez duela gordetzen ezer hurrengo saiorako. CTAP tresnak, ordea, zure corpusak gordetzen ditu, adierazgailu guztietatik nahi dituzunak aukeratu ditzakezu eta adierazgailu-multzoa gorde eta, bukatzeko, analisiak ere gorde ditzakezu. Aurrerago datuak modu ezberdinetan bistaratzeko. Oso tresna erabilgarria da eta sendoa: aukera asko ematen dituena. Gainera, hizkuntzen irakaskuntza aztertzeko erreferentzia bibliografikoetan aipatu diren ezaugarri gehienak aztertzen ditu eta hori egiteko punta-puntako hizkuntza-teknologia erabiltzen du.
Oraingoan ere proba bat egingo, baina oraingoa libreagoa izango da. Nahi baduzue corpus bera erabil dezakezue hirugarren jarduera hau egiteko:
Corpusa igo, adierazgailu batzuk aukeratu (asko ez, denbora itxaron beharko duzue eta), analisia osatu eta emaitzak aztertu CTAP tresnarekin.
Guk honela egin dugu:
- Testuak lehen zutabean daude, eta lerroetan testuen informazioa. Goian testu konplexuak jarri ditugu, behean sinpleak (hobeto ikusteko).
- Akeratu ditugun adierazgailuak goiburuan dituzue eta horien emaitzak azpian.
Text_title | Lexical Richness: Type Token Ratio (Uber) | Syntatic Complexity Feature: Complex T-unit Ratio |
2-philosophy-C.txt | 49.59 | 0.37 |
4-politics-C.txt | 54.80 | 0.50 |
9-basque-C.txt | 57.27 | 0.48 |
7-messi-C.txt | 37.77 | 0.34 |
6-madonna-C.txt | 46.27 | 0.42 |
1-philosophy_S.txt | 33.19 | 0.79 |
3-politics-S.txt | 35.75 | 0.79 |
10-basque-S.txt | 45.85 | 0.30 |
5-madonna-S.txt | 36.91 | 0.27 |
8-messi-S.txt | 38.69 | 0.12 |
Erreferentzia:
- Yasseri, T., Kornai, A., & Kertész, J. (2012). A practical approach to language complexity: a Wikipedia case study. PloS one, 7(11), e48386.