Ana səhifə

Leesbaarheidsonderzoek: oude problemen, nieuwe kansen


Yüklə 422 Kb.
səhifə3/3
tarix25.06.2016
ölçüsü422 Kb.
1   2   3

8 Conclusies en discussie

We hebben betoogd dat met het beschikbaar komen van nieuwe taaltechnologie en nieuw tekstverwerkingsonderzoek beter leesbaarheidsonderzoek mogelijk moet zijn, en we hebben een eerste verkenning uitgevoerd naar de mogelijkheden. Er is zowel goed nieuws als slecht nieuws te melden.

Om te beginnen blijkt het inderdaad mogelijk om met software als Tadpole en Alpino interessante tekstkenmerken te identificeren. Daarbij gaat het vaak om zaken die voor computationeel taalkundigen erg elementair zijn. Het opzoeken van tekstwoorden in een zelf te kiezen woordfrequentielijst, al of niet gelemmatiseerd, maakt het mogelijk om eenvoudig allerlei woordfrequentie-effecten te bekijken. Verder is het winst dat door tagging woordsoorten worden toegekend, door Named Entity Recognition namen van personen en plaatsen betrouwbaar kunnen worden aangewezen, met morfologische analyse nominalisaties kunnen worden herkend en een nieuwe woordlengtemaat kan worden gedefinieerd. En met syntactische parsing kunnen we kenmerken aanwijzen als afhankelijkheidslengtes, het complexiteitsniveau van syntactische constructies (D-Levelwaarde), lijdende vormen, en het aantal nominale bepalingen. Het is voor taalbeheersings- en tekstonderzoekers erg nuttig als deze mogelijkheden publiek beschikbaar komen.

Of al deze kenmerken belangrijk zijn voor de begrijpelijkheid van een tekst, is nog minder duidelijk. Het antwoord op die vraag lijkt bevestigend te luiden, omdat de T-Scan voorspelling zo’n 10% beter is dan die van de CLIB. Maar scepsis is op dit punt gerechtvaardigd. Laten we aannemen dat de cloze-testen een verdedigbare definitie van tekstbegrip geven. Dan moeten we allereerst vaststellen dat het hier gaat om basisschoollezers, en dat generalisatie naar andere lezers niet direct mogelijk lijkt. Het meest duidelijk wordt dat gedemonstreerd door de belangrijke rol van woordlengte in onze data. Het effect van woordlengte verdwijnt naarmate lezers ouder worden, waarschijnlijk al tijdens de basisschool. Het zit ons een beetje dwars dat we bij woordlengte geen interactie met leerjaar hebben gevonden.

Een meer principieel punt is dat we bij veel significante voorspellers geen goede verklaring hebben, ook niet voor onze basisschoollezers. Zo weten we nog niet wat lange zinnen moeilijk maakt, omdat afhankelijkheidslengtes niet beter voorspellen dan zinslengtes. Meer in het algemeen is onze ervaring dat leesbaarheidspredictoren onderling uitwisselbaar blijken: wanneer er een weggelaten wordt, neem een ander de lege plaats in. Het sterkste voorbeeld daarvan is dat de cloze-scores zonder woord- en zinslengte bijna even goed voorspeld worden, maar dan met meer intelligent ogende kenmerken. Overigens kan men dat ook positief beoordelen: leesbaarheidsanalyses met deze meer intelligente kenmerken zijn minder makkelijk te ‘foppen’ in die zin dat ze niet uitnodigen tot cosmetische tekstveranderingen.

Een ander, daarmee verbonden probleem is dat voorspellers in regressie-analyses op onvoorspelbare manieren interageren. Daarom is het moeilijk om op dit moment conclusies te trekken over het belang van concreetheid van teksten. In onze analyses bleken de concreetheidskenmerken soms wel, en soms weer niet een rol te spelen, afhankelijk van de andere voorspellers in het model.

De conclusie moet zijn dat we nog weinig causale uitspraken kunnen doen. Dat betekent dat we ook nog niet ver zijn met het aanwijzen van begrijpelijkheidsproblemen in teksten, en dus evenmin met tekstadviezen. De eerste twee problemen uit par. 2 zijn dus nog lang niet opgelost. Wel blijkt dat leesbaarheidsonderzoekers gelijk hebben als ze aannemen dat hun ‘domme’ predictoren aardig correleren met meer aannemelijke oorzaken van tekstmoeilijkheid. We weten echter niet zeker of onze nieuwe predictoren causaal relevant zijn. Zeker, nominalisaties (zoals woorden die eindigen op –heid) zijn intuïtief gerelateerd aan abstractere en moeilijker teksten. Maar het valt ons moeilijk te geloven dat het kleine aantal van die woorden in onze teksten (gemiddeld minder dan 1 op de 100 woorden) daadwerkelijk de gemiddelde lagere cloze-scores van die teksten verklaart. Aannemelijker is dat nominalisaties samengaan met zaken die de tekst werkelijk moeilijk maken. Kortom, ook meer intelligente talige predictoren garanderen geen causale relevantie.

Een ander probleem dat we hebben proberen aan te pakken is het ontbreken van tekststructurele predictoren. Onze connectiefmaten en argument-overlap bleken geen significante voorspellers in de modellen. Dat kan te maken hebben met het feit dat connectieven niet al te veel voorkomen in deze vrij eenvoudige teksten en dat veel referentiële links door voornaamwoorden gerealiseerd worden en niet door inhoudswoorden.

Een ontnuchterend gegeven is verder dat, zoals reeds geponeerd door Anderson & Davison (1988), predictoren uit leesbaarheidsformules inderdaad veel minder variantie verklaren dan meestal wordt aangenomen. Van de individuele scores wordt ruim 30% verklaard, tegenover de 70% die in geaggregeerde analyses lijkt te kunnen worden begrepen. Nu is 30% zeker niet niets, maar enige bescheidenheid zou de leesbaarheidsonderzoeker wel passen.

Daar staat tegenover dat onderzoek op individuele prestaties theoretisch een stuk interessanter is, omdat het zicht biedt op mogelijke interacties tussen lezers- en tekstkenmerken. Hierboven bleek al dat het effect van zinslengte afneemt met de leerjaren.

Ten slotte een opmerking over het laatste probleem uit par. 2: we hebben hierboven gewerkt met een globale score per tekst. Daardoor wordt de variantie binnen teksten systematisch onderschat; bovendien blijft onduidelijk waar in de tekst zich begripsproblemen kunnen voordoen. Dit probleem raakt de kern van de onzekere relatie tussen leesbaarheidsonderzoek en tekstverbetering. Een oplossing ervan zal ingrijpende koerswijzigingen vergen. Ten eerste moet gezocht gaan worden naar een ander type voorspellers, die een weerslag zijn van bepaalde gebeurtenissen in de tekst: extreem moeilijke zinnen of woorden, of eigenaardige overgangen van de ene naar de andere zin of alinea. Met name de analyse van deze overgangen vraagt om meer contextgevoelige, sequentiële tekstkenmerken dan tot nu toe gebruikt zijn. De automatische afleiding van dat soort kenmerken is reeds mogelijk, en het effect ervan op het lezen begint nu te worden onderzocht. We denken aan de semantische overlap tussen tekstdelen zoals bepaald met Latent Semantic Analysis (Pynte e.a. 2008) en aan de voorspelbaarheid van woorden en zinsconstructies (Demberg en Keller 2008). Onderzoek naar het effect van dit soort kenmerken vraagt ook andere verwerkingsmaten dan de gebruikelijke off-line begripstoetsen. In plaats daarvan kunnen oogbewegingsdata worden geanalyseerd. Dat soort data zou het daarnaast mogelijk maken de status van off-line data zoals cloze-scores beter te bepalen.
Vatten we dit alles samen. Nieuwe taaltechnologie maakt het mogelijk meer interessante kenmerken van teksten te beschrijven, en maakt een kleine predictiewinst mogelijk. Het onderzoek naar de begripseffecten van die kenmerken moet op dit moment echter bescheiden zijn in zijn pretenties. Ten eerste omdat niet zoveel variantie verklaard wordt als wel eens wordt gedacht. Ten tweede omdat er nog maar weinig betrouwbare causale uitspraken gedaan kunnen worden.

Onze conclusie is dat leesbaarheidsonderzoek meer aandacht moet besteden aan de feitelijke rol van tekstkenmerken tijdens het begripsproces. Daarbij zouden nieuwe, sequentiële tekstkenmerken wel eens belangrijke voorspellers kunnen gaan vormen.


Voetnoten

1. Dank aan Huub van den Bergh voor zijn hulp bij deze analyse.


Literatuur
Aghababian, V. & T.A. Nazir (2000). Developing normal reading skills: aspects of the visual processes underlying word recognition. Journal of Experimental Child Psychology 76, 123-150.

Anderson, R.C. & A. Davison (1988). Conceptual and empirical bases of readability formulas. In: A. Davison & G.M. Green, Linguistic complexity and text comprehension: Readability issues reconsidered. Hillsdale, NJ: Lawrence Erlbaum, pp. 23-53.

Bailin, A. & A. Grafstein (2001). The linguistic assumptions underlying readability formulae: a critique. Language and Communication 21 (3), 285-301.

Bijeljac-Babic, R., V. Millogo, F. Farioli & J. Grainger (2004). A developmental investigation of word length effects in reading using a new on-line word identification paradigm. Reading and Writing 17, 411-431.

Bolt, A., & Spooren, W. (2003). De complexiteit van naamwoordstijl: De gesubstantiveerde infinitief experimenteel onderzocht. In L. Van Waes, P. Cuvelier, G. Jacobs & I. De Ridder (Red.), Studies in Taalbeheersing 1 (pp. 71-82)

Bormuth (1966). Readability: a new approach. Reading Research Quarterly (1), 79-132.

Bosch, van den A., Busser, G.J., Daelemans, W. en Canisius, S. (2007). An efficient memory-based morphosyntactic tagger and parser for Dutch. F. van Eynde, P. Dirix, I. Schuurman, en V. Vandeghinste (Eds.), Selected Papers of the 17th Computational Linguistics in the Netherlands Meeting, Leuven, Belgium, 99-114.

Bradac, J.J., R.A. Davies & J.A. Courtwright (1977). The role of prior message context in judgment of high- and low-diversity messages. Language and Speech 20, 295-307.

Breland, H.M. (1996). Word frequency and word difficulty: a comparison of counts in four corpora. Psychological Science 7(2), 96-99.

Britton, B.K. & S. Gülgöz (1991). Using Kintsch’s computational model to improve instructional text: effects of repairing inference calls on recall and cognitive structures. Journal of Educational Psychology 83 (3), 329-345.

Brown, C., T. Snodgrass, S. J. Kemper, R. Herman & M.A. Covington (2008). Automatic Measurement of Propositional Idea Density from Part-of-Speech Tagging. Behavioral Research Methods 40 (2), 540-545.

Brück, T. vor der, S. Hartrumpf, H. Helbig (2008). A readability checker with supervised learning using deep indicators. Informatica 32 (429-435).

Brysbaert, M., M. Lange & I van Wijnendaele (2003). The effects of age-of-acquisition and frequency-of-occurrence in visual word recognition: further evidence from the Dutch language. European Journal of Cognitive Psychology 12 (1), 65-85.

Burgess, C. & K. Livesay (1998). The effect of corpus size in predicting reaction time in a basic word recognition task: moving on from Kucera and Francis. Behavior Research Methods, Instruments & Computers 30 (2), 272-277.

Camblin, C., Ledoux, K., Boudewyn, M., Gordon, P.C. & Swaab, T.Y. (2007). Processing new and repeated names: Effects of coreference on repetition priming with speech and fast RSVP. Brain Research, 1146, p. 172, 184.

Collins-Thompson, K. & J. Callan (2005). Predicting reading difficulty with statistical language models. Journal of the American Society for Information Science and Technology 56 (13), 1448-1462.

Covington, M.A., C. He, C. Brown, L. Naçi & J. Brown (2006). How complex is that sentence? A proposed revision of the Rosenberg and Abbeduto D-Level Scale. CASPR Research Report 2006-01. Artificial Intelligence Center, The University of Georgia, Athens.

Croll, W. & S. Moskaluk (1977). Should Flesch’ counts count? Teaching of Psychology 4 (1), 78-79.

Crossley, S.A., D.F. Dufty, P.M. McCarthy & D.S. McNamara (2006). Toward a new readability: a mixed model approach. In: D.S. McNamara & G. Trafton (eds.), Proceedings of the 29th annual conference of the Cognitive Science Society, Austin, Texas: Cognitive Science Society, 197-202.

Dale, E. & J.S. Chall (1948). A formula for predicting readability. Educational Research Bulletin 27, 37-54.

Degand, Liesbeth & Ted Sanders (2002). The impact of relational markers on expository text comprehension in L1 and L2. Reading and Writing 15 (7-8): 739-757.

Demberg, V. & F. Keller (2008). Data from eye-tracking corpora for theories of syntactic processing complexity. Cognition 109, 193-210.

Dickes, P., Steiwer, L. (1977). Ausarbeitung von Lesbarkeitsformeln für die deutsche

Sprache. In: Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie IX (1), 20-28



Douma, W.H. (1960). De leesbaarheid van landbouwbladen: een onderzoek naar en een toepassing van leesbaarheidsformules. Landbouwhogeschool Wageningen, Afdeling Sociologie en Sociografie, Bulletin nr. 17.

Ferreira, F. & J.L. Stacey (2001). The misinterpretation of passive sentences. Manuscript.

Ferreira, F. (2003). The misinterpretation of non-canonical sentences. Cognitive Psychology 47, 164-203.

Field, A. (2005). Discovering statistics using SPSS. Sage Publications, London etc.

Flesch, R. (1948). A new readability yardstick. Journal of Applied Psychology. 32 (3), 221-233.

Gagné, C. (2002). The competition-among-relations-in-nomimals theory of conceptual combination: implications for stimulus class formation and class expansion. Journal of the Experimental Analysis of Behavior 78, 551-656.

Gibson, E. (2000). The Dependency Locality Theory: a distance based theory of linguistic complexity. In In Y. Miyashita, A. P. Marantz & W. O’Neil (eds.), Image, language, brain Cambridge: MIT Press, 95–126.

Halliday, M. A. K. (1985). Spoken and written language. Oxford: Oxford University Press.

Heilman, M.J., K. Collins-Thompson, J. Callan & M.Eskenazi (2007). Combining lexical and grammatical features to improve readability measures for first and second language texts. Proceedings of NAACLHLT 2007, 460-467.

Jansen, C. & E.T. Woudstra (1979). Theorie en praktijk van het Nederlandse leesbaarheidsonderzoek. Een analyse van twee formules. Tijdschrift voor Taalbeheersing 1 (1), 43-60.

Jansen, C. (2005). Kwaliteit overheidscommunicatie meetbaar gemaakt? Pretenties van Bureau Taal tegen het licht gehouden. Tekstblad jaargang 2005, nr. 4, 9-11.

Jansen, C. & L. Lentz (2008). Hoe begrijpelijk is mijn tekst? De opkomst, neergang en terugkeer van de leesbaarheidsformules. Onze Taal 77 (1), 4-7.

Jonz, J. (1990). Another turn in the conversation: what does cloze measure? TESOL Quarterly 24 (1), 61-82.

Just, M.A. & P.A. Carpenter (1987). The psychology of reading and language comprehension. Newton, Mass.: Allyn and Bacon.

Kamalski (2007). Coherence marking, comprehension and persuasion. On the processing and representation of text. Utrecht: LOT.

Kaup, B., R.A. Zwaan, & J. Lüdtke (2007). The experiential view of language comprehension: how is negation represented? In: Schmalhofer, F., Perfetti, C.A. (Eds.), Higher Level Language Processes in the Brain: Inference and Comprehension Processes. Erlbaum, Hillsdale, 255-288.

Kemper, S., J.D. Jackson, H. Cheung & C.A. Anagnopoulos (1993). Enhancing older adults’ reading comprehension. Discourse Processes 16 (4), 405-428.

Kintsch, W. & J. Keenan (1973). Reading rate and retention as a function of the number of proposition in the base structure of sentences. Cognitive Psychology 5, 257-274.

Kintsch, W., E. Kozminsky, W.J. Streby, G. McKoon & J.M. Keenan (1975). Comprehension and recall of text as a function of content variables. Journal of Verbal Learning and Verbal Behavior 14, 158-169.

Kintsch, W. & D. Vipond (1979). Reading comprehension and readability in educational practice and psychological theory. In L.G. Nillson (ed.), Memory: processes and problems. Hillsdale, NJ: Erlbaum, 329-365.

Klare, G.R. (1963). The measurement of readability. Ames: Iowa State University.

Kliegl, R., E. Grabner, M. Rolfs & R. Engbert (2004). Length, frequency, and predictability of words on eye movements in reading. European Journal of Cognitive Psychology 16 (1/2), 262-284.

Konieczny, L. (2000). Locality and parsing complexity. Journal of Psycholinguistic Research (29 (6), 627-645.

Konieczny, L. & P. Döring (2003). Anticipation of clause-final heads. Evidence from eye-tracking and SRNs. Proceedings of the ICCS/ASCS-2003 Joint International Conference onf Cognitive Science. Sidney, Australia, 13-17- July 2003.

Land, J. (2009). Zwakke lezers, sterke teksten? Effecten van tekst- en lezerskenmerken op het tekstbegrip en de tekstwaardering van VMBO-leerlingen. Stichting Lezen Reeks 13.

Malouf, R. & G van Noord, G. (2004). Wide coverage parsing with stochastic attribute value grammars. Proceedings of the IJCNLP-04 Workshop Beyond Shallow Analyses-Formalisms and statistical modeling for deep analyses.

Pander Maat, H. (2008). Woordfrequentie en woordmoeilijkheid: een onderzoek onder MBO-scholieren. Universiteit Utrecht.

Petrič, I. (1992). Here is the news. Predicting listening performance for news texts. Dissertation Utrecht University.

Pitler, E. & A. Nenkova (2008). Revisiting readability: a unified framework for predicting text quality. http://www.cis.upenn.edu/~nenkova/papers/revisitingReadability.pdf

Pynte, J., B. New & A. Kennedy (2008). On-line contextual influences during reading normal text: a multiple regression analysis. Vision Research 48, 2172-2183.

Qureshi, M.Y. (1979). Logical versus empirical estimates of readability and human interest of general psychology textbooks. Teaching of Psychology 6 (4), 202-205.

Qureshi, M.Y. (1989). Logical versus empirical readability and human interest scores for introductory texts published between 1977 and 1988. Teaching of Psychology 16 (1), 4-7.

Rayner, K., J. Ashby, A. Pollatsek & E.D. Reichle (2004). The effects of frequency and predictability on eye fixations in reading: implications for the E-Z reader model. Journal of Experimental Psychology: Human Perception and Performance.

Rayner, K., E.D. Reichle, M.J. Stroud & C.C. Williams (2006). The effect of word frequency, word predictability, and font difficulty on the eye movements of young and old readers. Psychology and Aging 21 (3), 448-465.

Redish, J. (2000). Readability formulas have even more limitations than Klare discusses. ACM Journal of Computer Documentation 24 (3), 132 – 137.

Redish, J.C. & J. Selzer (1985). The place of readability formulas in technical communication. Technical Communication 32(3), 46-52.

Renkema, J. (1983). Onderzoek naar woordenrijkdom. Taalstatistische analyse via een microcomputer. Tijdschrift voor Taalbeheersing 5 (3), 275-289.

Rosenberg, S. & L. Abbeduto (1987). Indicators of linguistic competence in the peer group conversational behavior of mildly retarted adults. Applied Psycholinguistics 8, 19-32.

Rayner, K. & S.A. Duffy (1986). Lexical complexity and fixation times in reading: effects of word frequency, verb complexity, and lexical ambiguity. Memory and Cognition 14:3, 191-201.

Ryder, R.J. & W.H. Slater (1988). The relationship between word frequency and word knowledge. Journal of Educational Research 81 (5), 312-317.

Sadoski, M. (2001). Resolving the Effects of Concreteness on Interest, Comprehension, and Learning Important Ideas From Text. Educational Psychology Review 13 (3), 263-281.

Sadoski, M., E. Goetz & M. Rodriguez (2000). Engaging texts: effects of concreteness on comprehensibility, interest, and recall in four text types. Journal of Educational Psychology 92 (1), 85-95.

Sanders, T.J.M. & L. Noordman (2000). The role of coherence relations and their linguistic markers in text processing. Discourse Processes 29, 37-60.

Sanders, T.J.M & L. Staphorsius (2008). Leesbaarheid en tekststructuur in basisschoolteksten . Een exploratief onderzoek naar de relatie tussen oppervlakkige en fundamentele voorspellers van begrijpelijkheid. Tijdschrift voor Taalbeheersing 40, 174–197.

Schwarm, S.E. & M. Ostendorf (2005). Reading level assessment using support vector machines and statistical language models. Proceedings of ACL 523-530.

Shanahan, T., M.L. Kamil & A.W. Tobin (1982). Cloze as a measure of intersentential comprehension. Reading Research Quarterly 17, 229-255.

Staphorsius, G. (1994). Leesbaarheid en leesvaardigheid. De ontwikkeling van een domeingericht meetinstrument. Cito, Arnhem.

Stenner, A.J. (1996). Measuring reading comprehension with the Lexile Framework. Paper presented at the Fourth North American Conference on Adolescent/Adult Literacy, Washington DC, February 1996.

Temperley, D. (2007). Minimization of dependency length in written English. Cognition 105 (2), 300-333.

Tuldava, J. (1993). Measuring text difficulty. Glottometrika 14, 69-81.

Visser, W. & K. Heij (2006). Schrijven in eenvoudig Nederlands. SDU Den Haag.

Wharton, W.P. (1980). Higher-imagery words and the readability of college-history texts. Journal of Mental Imagery 4 (2), 129-147.



1   2   3


Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©atelim.com 2016
rəhbərliyinə müraciət