Die Arbeit mit unstrukturierten textbasierten Daten

Eine Reflexion zu Mixed-Methods-Ansätzen für Textanalysen

  • Franziska Hein-Pensel TU Ilmenau
Schlagworte: Mixed-Methods, Qualitätsleitlinien, Text Mining, Qualitative Textanalyse, Quantitative Textanalyse

Abstract

Aufgrund der steigenden Verfügbarkeit großer Textdaten sind Text Mining und insbesondere Topic Modeling relevante Methoden, um sich Forschungsfragen in verschiedenen Fachbereichen zu nähern (Roberts et al. 2019). Topic Modeling kann dabei als eine explorative Technik beschrieben werden, um Informationen aus Textdaten in großem Maßstab zu gewinnen (DiMaggio et al. 2013). Dies führt dazu, dass das Interesse an Topic Modeling im letzten Jahrzehnt deutlich gewachsen ist und sich von der Informatik in andere Disziplinen, wie der Soziologie (z.B. Apishev et al. 2016; Bohr, Dunlap 2018) oder den Wirtschaftswissenschaften (z.B. Wang et al. 2017; Schmiedel et al. 2019), verzweigt hat.

Mit Hilfe einer methodischen Kombination von Topic Modeling und qualitativer Kodierung können Wissenschaftler*innen Informationen aus einem Datenkorpus gewinnen, die von Hand nicht vollständig auswertbar gewesen wären (z.B. Shimizu 2017; Croidieu, Kim 2018). Dieser methodengemischte Ansatz erfordert eine konstante Zirkulation zwischen der Interpretation des Outputs und der Datenaufbereitung für die quantitative Analyse. Aufgrund der Komplexität dieses Prozesses ist sowohl Zeit als auch Sorgfalt gefordert.

Trotz der wachsenden Popularität von Topic Modeling in den Sozialwissenschaften fehlt es nach wie vor an gemeinsamen Qualitätsrichtlinien für Wissenschaftler*innen, um die Transparenz ihrer Arbeit zu gewährleisten (Antons et al. 2020). Im Vergleich dazu gehört es in der Informatik zur gängigen Praxis, den Leser*innen einen detaillierten technischen Bericht anzubieten, der alle Informationen zur Erstellung der präsentierten Ergebnisse enthält. Hierdurch wird die Nachvollziehbarkeit der Analyseschritte gewährleistet.

Der vorliegende Beitrag plädiert dafür, dass bei der Implementierung eines Text Mining Algorithmus aus der Informatik in die Sozialwissenschaft die erzeugten Ergebnisse mit den gleichen Standards wie in ihrer Ursprungsdisziplin behandelt werden sollten und zeigt hierfür Möglichkeiten auf. In diesem Beitrag wird die Verwendung von Topic Modeling und induktiver Kodierung sowie das Zusammenspiel beider Methoden diskutiert. Der Mehrwert dieser Studie besteht darin, Qualitätsleitlinien für den Umgang mit unstrukturierten Textdaten zur Gewährleistung von Transparenz vorzustellen.

Literaturhinweise

Antons, David, Eduard Grünwald, Patrick Cichy und Torsten O. Salge. 2020. The application of text mining methods in innovation research: Current state, evolution patterns, and development priorities. R&D Management 50:329–351.

Apishev, Murat, Sergei Koltcov, Olessia Koltsova, Sergey Nikolenko und Konstantin Vorontsov. 2017. Additive Regularization for Topic Modeling in Sociological Studies of User-Generated Texts. In Advances in computational intelligence. 15th Mexican International Conference on Artificial Intelligence, MICAI 2016 Cancun, Mexico, October 23-28, 2016 Proceedings, Part I. Lecture Notes in Computer Science, Hrsg. Grigori Sidorov und Oscar Herrera-Alcántara, 169–184. Cham: Springer.

Blei, David, Andrew Y. Ng und Michael I. Jordan. 2003. Latent Dirichlet Allocation. Journal of Machine Learning Research 3:993–1022.

Bohr, Jeremiah, und Riley E. Dunlap. 2018. Key Topics in environmental sociology, 1990–2014: Results from a computational text analysis. Environmental Sociology 4:181–195.

Carp, Frances M., und Abraham Carp. 1981. The validity, reliability and generalizability of diary data. Experimental aging research 7:281–296.

Croidieu, Grégoire, und Phillip H. Kim. 2018. Labor of Love: Amateurs and Lay-expertise Legitimation in the Early U.S. Radio Field. Administrative Science Quarterly 63:1–42.

DiMaggio, Paul, Manish Nag und David Blei. 2013. Exploiting affinities between topic modeling and the sociological perspective on culture: Application to newspaper coverage of U.S. government arts funding. Poetics 41:570–606.

Dubois, Anna, und Lars-Erik Gadde. 2002. Systematic combining: An abductive approach to case research. Journal of Business Research 55:553–560.

Früh, Werner. 2015. Inhaltsanalyse. Theorie und Praxis, Bd. 2501. 8., überarbeitete Auflage. Konstanz, München: UVK Verlagsgesellschaft mbH; UVK / Lucius.

Giegler, Helmut. 1992. Zur computerunterstützten Analyse sozialwissenschaftlicher Textdaten: Quantitative und qualitative Strategien. In Analyse verbaler Daten, Hrsg. Jürgen H. P. Hoffmeyer-Zlotnik, 335–388. Wiesbaden: VS Verlag für Sozialwissenschaften.

Gioia, Dennis A., Kevin G. Corley und Aimee L. Hamilton. 2013. Seeking Qualitative Rigor in Inductive Research. Organizational Research Methods 16:15–31.

Gioia, Dennis A., und James B. Thomas. 1996. Identity, Image, and Issue Interpretation: Sensemaking During Strategic Change in Academia. Administrative Science Quarterly 41:370–403.

Hannigan, Timothy R., Richard F. J. Haans, Keyvan Vakili, Hovig Tchalian, Vern L. Glaser, Milo S. Wang, Sarah Kaplan und P. D. Jennings. 2019. Topic Modeling in Management Research: Rendering New Theory from Textual Data. Academy of Management Annals 13:586–632.

Kohlbacher, Florian. 2006. The Use of Qualitative Content Analysis in Case Study Research. Forum Qualitative Sozialforschung 7. https://doi.org/10.17169/fqs-7.1.75

Kuckartz, Anne, und Michael J. Sharp. 2011. Responsibility: A Key Category for Understanding the Discourse on the Financial Crisis—Analyzing the KWALON Data Set with MAXQDA 10. Forum Qualitative Sozialforschung 12.

Leung, Lawrence. 2015. Validity, reliability, and generalizability in qualitative research. Journal of Family Medicine and Primary Care 4:324–327.

Lukka, Kari, und Sven Modell. 2010. Validation in interpretive management accounting research. Accounting, Organizations and Society 35:462–477.

MacQueen, Kathleen M., Eleanor McLellan, Kelly Kay und Bobby Milstein. 1998. Codebook Development for Team-Based Qualitative Analysis. Cultural Anthropology Methods 10:31–36.

Marsh, Herbert W., Upali W. Jayasinghe und Nigel W. Bond. 2008. Improving the peer-review process for grant applications: reliability, validity, bias, and generalizability. The American Psychologist 63:160–168.

Mayring, Philipp. 2000. Qualitative Inhaltsanalyse. Forum Qualitative Sozialforschung / Forum: Qualitative Social Research 1(2), Art. 20, http://nbn-resolving.de/urn:nbn:de:0114-fqs0002204

Mayring, Philipp. 2015. Qualitative Inhaltsanalyse. Grundlagen und Techniken. 12., überarb. Aufl. Weinheim: Beltz.

Mayring, Philipp. 2019. Qualitative Content Analysis. Demarcation, Varieties, Developments. Forum Qualitative Sozialforschung 20. https://doi.org/10.17169/fqs-1.2.1089

Roberts, Margaret E., Brandon M. Stewart und Dustin Tingley. 2019. stm : An R Package for Structural Topic Models. Journal of Statistical Software 91:1–40.

Roller, Margaret R. 2019. A Quality Approach to Qualitative Content Analysis. Similarities and Differences Compared to Other Qualitative Methods. Forum Qualitative Sozialforschung 20(3). https://doi.org/10.17169/fqs-20.3.3385

Schmiedel, Theresa, Oliver Müller und Jan vom Brocke. 2019. Topic Modeling as a Strategy of Inquiry in Organizational Research: A Tutorial With an Application Example on Organizational Culture. Organizational Research Methods 22:941–968.

Shimizu, Takumi. 2017. Material-Discursive Practices in Technology Standards Development: A Topic-Modeling Approach to Technology Evolution. Twenty-third Americas Conference on Information Systems, Boston. https://core.ac.uk/download/pdf/301371959.pdf

Stone, Philip J., Dexter Dunphy, Marshall Smith S. und Daniel M. Ogilvie. 1966. The General Inquirer. A Computer Approach to Content Analysis. Cambridge, Mass., & London: M.I.T. Press.

Tran, Nam K., Sergej Zerr, Kerstin Bischoff, Claudia Niederée und Ralf Krestel. 2013. „Gute Arbeit“. Topic Exploration and Analysis Challenges for Corpora of German Qualitative Studies. Proceedings of ENRICH 2013 – SIGIR 2013 Workshop, 15–22.

Wang, Yinying, Alex J. Bowers und David J. Fikis. 2017. Automated Text Data Mining Analysis of Five Decades of Educational Leadership Research Literature: Probabilistic Topic Modeling of EAQ Articles from 1965 to 2014. Educational Administration Quarterly 53:289–323.

Wilden, Ralf, Jan Hohberger, Timothy M. Devinney und Dovev Lavie. 2018. Revisiting James March (1991): Whither exploration and exploitation? Strategic Organization 16:352–369.

Yin, Robert K. 1994. Discovering the Future of the Case Study. Method in Evaluation Research. American Journal of Evaluation 15:283–290.

Veröffentlicht
2021-08-09
Rubrik
Sektion Methoden der qualitativen Sozialforschung: ›Mixed Methods‹ zwischen Methodenintegration und Methodenpluralismus