شناسایی و دسته‌بندی موضوعی اشعار حافظ با استفاده از هوش مصنوعی و متن‌کاوی

نوع مقاله : مقاله پژوهشی

نویسنده

پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)

10.22108/jpll.2025.144858.1914

چکیده

شناسایی موضوعات و دسته‌بندی اشعار دیوان حافظ مورد توجه بسیاری از حافظ‌پژوهان است و مطالعات گوناگونی در این عرصه انجام شده است که عمده آنها به دسته‌بندی تاریخی یا دوره عمر شاعر توجه داشته‌اند و یا با استفاده از نظر خبرگان حوزه ادبیات فارسی به این امر پرداخته‌اند. در این پژوهش موضوعات اشعار دیوان حافظ بر اساس روشی مبتنی بر هوش مصنوعی و متن‌کاوی و بدون اعمال نظر فرد خبره مدنظر قرار گرفته است که پس از بیان ویژگی‌های ظاهری اشعار دیوان حافظ،‌ و انجام پیش‌پردازش، هشت موضوع اصلی در دیوان شناسایی شده است و برمبنای واژگان پرکاربرد هر موضوع و با کمک هوش مصنوعی، این موضوعات نامگذاری شده‌اند.‌ موضوعات استخراج شده شامل «سوز و گداز»، «مدح و ستایش»، «فراق و وصال»، «زیبایی و دلربایی»، «عیش و مستی»، «راز عشق»، «طریقت و عرفان» و «رندی و آزادگی» است. در ادامه، اشعار حافظ در این موضوعات دسته‌بندی شده است و میزان ارتباط هر شعر با هر موضوع بر اساس بیشترین ارتباط و یا برخورداری از حدآستانه ارتباط، استخراج شده است. روش مورد استفاده در این پژوهش که مستقل از نظر خبرگان و کاملا مبتنی بر یادگیری ماشین و هوش مصنوعی است و با واکاوی واژگان به کنکاش موضوعات موجود در دیوان حافظ پرداخته است می‌تواند در دیگر متون ادبی نیز مورد استفاده قرار گیرد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Topic Identification and Classification of Hafez's Poems Using Artificial Intelligence and Text Mining

نویسنده [English]

  • Mohammad Rabiei
Research Institute for Information Science and Technology (IranDoc)
چکیده [English]

Topic extraction and classification of Hafez's poetry has long been a focus of scholarly attention, with existing studies primarily adopting either historical periodization approaches or relying on expert interpretations from Persian literature specialists. This study presents a novel computational methodology for identifying and categorizing topics in Hafez's Divan using artificial intelligence and text mining techniques, completely independent of human expert judgment.

Following text preprocessing and feature extraction, our analysis revealed eight principal topics within the Divan. These topics were automatically labeled based on their most characteristic vocabulary using AI assistance: 1) Anguish and Ardor, 2) Panegyric and Praise, 3) Separation and Reunion, 4) Beauty and Allure, 5) Revelry and Intoxication, 6) The Mystery of Love, 7) Mysticism and Spirituality, and 8) Bohemianism and Libertarianism.

Each poem was systematically classified according to its strongest topic association, with threshold-based analysis employed to determine significant thematic connections. Our completely automated, machine learning-driven approach to lexical pattern analysis in Hafez's work demonstrates a reproducible methodology applicable to other literary corpora.

کلیدواژه‌ها [English]

  • Hafez'
  • s Divan, Topic Modeling, Text Mining, Natural Language Processing (NLP), Persian Poetry

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 04 خرداد 1404
  • تاریخ دریافت: 18 فروردین 1404
  • تاریخ بازنگری: 15 اردیبهشت 1404
  • تاریخ پذیرش: 04 خرداد 1404