اللهم و صلّ علی الطاهرة البتول، الزهراء ابنة الرسول، امّ الائمة الهادین ... و مستودعاً لحکمة؛ (بحارالانوار ، ص 181) اللهم صلّ علی فاطمة بنت نبیّک و زوجه ولیّک و امّ السبطین الحسن و الحسین ...؛(بحارالانوار، ج 99 ، ص 45) اللهم صل علی فاطمه و ابیها و بعلها و بنیها و سرّ المستودع فیها بعدد ما احاط به علمک
فهم ساختار موضوعي قرآن كريم: روي¬كرد چند متغيّرة اکتشافی مشاهده در قالب پی دی اف چاپ فرستادن به ایمیل
شماره سفینه - سفینه 60
دوشنبه ، 10 دی 1397 ، 09:20

چكيده: در اين مقاله، روشي­شناسي‌ِ كشف ساختار موضوعي قرآن كريم بر اساس يك ايدة بنيادي در داده‌كاوي و شيوه‌هاي مرتبط با آن ارائه شده و آن اين كه در برخي از متون، فراواني گونه‌هاي واژه‌ها، شاخص1[1]معتبري براي محتواي مفهومي آن‌ها است و اين ويژگي، معيار معتبري براي طبقه‌بندي آن‌ واژه‌ها نسبت به يكديگر فراهم مي‌سازد. از اين روش، براي كشف ارتباطات متقابل موضوعي ميان سوره‌هاي قرآن كريم از طريق لحاظ نمودن فراواني داده‌هاي واژه‌ايِ آن‌ سوره‌ها و سپس به كاربردن تحلیل خوشه‌اي به شیوه سلسله مراتبي، استفاده مي­شود. نتايجي كه در اينجا گزارش شده، نشان مي‌دهد كه روش­شناسي حاضر نتايج كاربردي2[2]در فهم قرآن كريم بر اساس معني‌شناسي[3] واژه‌هاي قرآن كريم دارد.

کلیدواژه­ها: تفسیر موضوعی؛ روش­شناسی ترکیبی؛ ساختارشناسی سوره­ها؛ داده­کاوی قرآنی.

1. مقدمه

   قرآن كريم يكي از كتاب هاي بزرگ مذهبي دنيا است و در قلب فرهنگ اسلامي جاي دارد. تفسير جامع و دقيق قرآن كريم، هم براي اعتقاد ميليون‌ها مسلمان در سراسر جهان و هم براي فهم دنياي غير اسلام از دين اسلام، مهم است. سنّت قديمي تفسير عالمانة قرآن كريم، ضرورتاً مبتني بر روش­هاي تاريخي- ادبيِ سنّتيِ تفسيرِ متن است[4] که به صورت دستی (و نه ماشینی) صورت می­گیرد. امّا، در حال حاضر، پیشرفت­ها در ارائه و تحلیل متن به صورت الكترونيكي، امکان به­ کارگیری فناوری­های موجود در حوزه­های پژوهشی نوپدید مانند داده­کاوی را در مورد تفسیر قرآن کریم فراهم می­سازد. تقريباً در حوزة مطالعات تحليل آماري قرآن كريم، كاري انجام نشده است.[5] نگارش مقالات در اين رشته، موجب بسط و توسعة نوعی تحلیل­گر واژه­شناسی برای قرآن کریم شده است.[6] (Dror et al., 2004)

   قرآن كريم يكصد و چهارده سوره دارد كه در پيوستاري از بلندترين سوره، بقره با دويست و هشتاد و شش آيه تا كوتاه­ترين سوره، كوثر با چهار آيه مرتب شده است. دليل روشني در دست نيست كه چرا سوره‌ها آن چنان كه در قرآن كريم هستند، مرتب شده‌اند. اين سوره‌ها ترتيب تاريخي ندارند و به نظر مي‌رسد تقريباً بر اساس طول از بزرگ‌ترين سوره در ابتداي قرآن كريم تا كوچك‌ترين سوره در انتهاي قرآن كريم مرتب شده‌اند. با اين فرض كه مرتب‌سازيِ اين سوره‌ها ظاهراً اجتهادي بوده، يكي از گام‌هاي نخستين در تفسير قرآن كريم به عنوان يك كلّ، كشف روابط موضوعي ميان اين سوره‌ها است.[7]

   اين مقاله، روش‌شناسي‌اي براي انجام اين‌گونه مطالعات، از طريق تحليل چند متغيرة اکتشافی ارائه مي‌دهد.

   اين مقاله چهار[8] بخش دارد: بخش نخست، درآمد است. بخش دوم، متن قرآني و آمايش داده‌ها پيش از تحليل را ارائه مي‌دهد. بخش سوم، به كاربرد فنون تحليل خوشه‌اي در مورد قرآن كريم و تفسير نتايج آن مي‌پردازد. بخش چهارم، نتيجه‌گيري و موضوعاتي را براي پژوهش‌هاي بعدي پيشنهاد مي‌كند.

2. داده‌ها

   داده‌هاي اين تحقيق بر اساس نسخه­ی الكترونيكي قرآن كريم محصول شركت «مسلم‌نت» است. اين نسخه، حرف‌نگاري الفباي غربي، از املاء عربي است. اين داده‌ها بر اساس علائمASCII [9]، غالباً با معادل‌هاي تك - نماد از آواهاي عربي و با جايگزيني اِعراب و نشانه‌هايي كه واكه‌هاي كوتاه را در املاء عربي با حروف لاتيني متناسب با آن­ها نشان مي‌دهند، لاتين نگاري شده است.

   در ماتريس فراواني F، سوره‌ها در ردیف­ها و واژه‌ها در ستون‌ها ارائه شده­اند و در هر سلول ، يك عدد كامل قرار دارد كه تعداد دفعات واژة   را كه در هر سورة  واقع شده، نشان مي‌دهد. اصولاً طراحي اين‌گونه ماتريس‌ها آسان است، اما در عمل برخي مسائل شناخته شده بروز مي‌كند.

2-1. رمزگشايي

   اگر شخصي بخواهد واژه‌ها را بشمارد، نخستين سؤالي كه براي او پيش مي‌آيد

 اين است كه واژه چيست؟ پاسخ به اين سؤال به صورت شگفت‌آوري مشكل است و اين مشكل، هم در زبان شناسي و هم در پردازش زبان طبيعي وجود دارد. (مانینگ و شوتز، 1999)[10] حتی اگر مانند این مقاله، محدود به زبان نگارش گردد، دو اختلاف نظر رخ می­دهد:

- تقطيع كلمات: در متون انگليسي، این باور عمومی که واژه، رشته­ای از حروف به هم چسبیده است که از طریق علائم نقطه­گذاری و/ یا فضای خالی مشخص می­شود، دیدگاه جا افتاده­ای است؛ در حالی که در مورد زبان­های دیگر این باور کم­تر است.

- ستاك (بُن): در زبان‌هايي كه بن‌هاي واژه‌هاي آن زبان‌ها داراي اشتقاقات صرفيِ گسترده‌ است؛ آيا اشتقاقات گوناگون صرفيِ يك بُن خاص، به عنوان واژه‌هاي متفاوت به شمار مي‌آيند؟

   در قرآن كريم، تقطيع كلمه‌ها به راحتي قابل حل است، زيرا املاء قرآن كريم به گونه‌اي است كه با استفاده از دو معيارِ علائم نقطه­گذاری و/ یا فضای خالی، مي‌توان واژه‌ها را به صورت قابل اعتمادي شناخت. بُن و اشتقاقات صرفي نيز به مانند گونه‌هاي یک واژه‌­ به شمار مي‌آيند[11] و براي دستيابي به اين موارد، متن الكترونيكي قرآن كريم با استفاده از بُن‌ساز محقق‌ساخته كه مشخصات و عملکرد آن در مقالة «ثابت» (2004) شرح شده، پردازش شد.

2-2. انتخاب واژه‌هاي كليدي

   واژه‌هاي نقش‌نما، مانند ضماير اشاره و حروف اضافه از متن حذف شدند و تنها واژه‌هاي معنادار باقي ماندند. افزون بر این، واژه­هایی که تنها یک بار به کار رفته­ بودند و در تعيين ارتباط ميان سوره‌ها نقشي نداشتند، حذف شدند.

3-2. استانداردسازي براي طول متن

   در مقدمه متذکر شدیم كه طول سوره‌ها از حدود دوازده تا چند هزار كلمه در نوسان است. نمودار زير، تعداد واژه‌هاي معنادار در هر سوره را -كه براساس كاهش تعداد، مرتب شده- نشان مي‌دهد.

alt

شكل1: نمودار تعداد واژه‌های معنادار در هر سوره

   روشن است چنان­چه واژه­ای با احتمال وقوع کم داشته باشیم، احتمال بیشتری دارد که این واژه در متنی طولانی بیاید تا در متنی کوتاه. بنابراین، به منظور مقایسة معنادار سوره­ها بر اساس نمودار واژه­هایشان، می­باید فراوانی­های اولیه واژه­ها را تعدیل نماییم تا بتوانیم نوسان طول سوره­ها را جبران کنیم. اين تعديل، بر اساس فرمول زير انجام شده است:

alt

   که در آن فراواني تعديل شده،  مقدار مختصات داده­هايِ ماتريسF،  فراواني اولیه،  مقدار ميانگين تعداد واژه‌ها در هر سوره در گسترة همة يكصد و چهارده سوره، و  تعداد واژه‌ها در سورة ام است.

   همچنین بايد توجّه شود كه به همان نسبتي كه طول متن كوتاه مي‌شود، احتمال وقوع يك واژة مشخص در سوره، حتي براي يك بار، نيز كم مي‌شود و بنابراين، بردار فراوانيِ آن نيز به صورت فزاينده‌اي تُنُك خواهد شد، كه عمدتاً شامل صفر می­باشد. زيرا صفر تعديل‌ناپذير است، توابعي كه متغير طول متن را خنثي مي‌كنند به صورت فزاينده‌اي نتايج غيرقابل اعتماد توليد مي‌كنند، در حالي كه طول متن كاهش يافته است.[12] بنابراين، در مقالة حاضر، تنها سوره‌هاي نسبتاً طولاني و به ويژه بيست و چهار سوره‌اي كه هزار يا بيش از هزار واژة محتوايي دارند، مورد ملاحظه قرار گرفته‌ است.

 

 

 

نام سوره

واژه‌ها

نام سوره

واژه‌ها

نام سوره

واژه‌ها

نام سوره

واژه‌ها

البقره

5739

الانفال

1156

الاسراء

1464

الشعراء

1208

آل عمران

3316

التوبه

2345

الكهف

1486

النمل

1069

النساء

3543

يونس

1732

طه

1265

القصص

1332

المائده

2681

هود

1809

الانبياء

1077

الاحزاب

1239

الانعام

2895

يوسف

1665

الحج

1195

الزمر

1107

الاعراف

3127

النحل

1729

النور

1236

غافر

1156

 

جدول 1: لیست سوره‌هاي با بيش از هزار واژه

   انتخاب هزار واژه به عنوان آستانة طول، اختياري است. اين‌گونه انتخاب‌هاي اختياري، به روش‌شناسي مقاله آسيبي نمي‌رساند. امّا روشن است كه هرگونه تحليل ضابطه­مندی از قرآن که از این روش­شناسی بهره می­گیرد، می­باید از پسِ این مشکل برآید که کدام سوره­ها را به روش اصولی بر مبنای طولشان مستثنی نماید؛ البته اگر چنین مشکلی وجود داشته باشد.

4-2. كاهش بعد

   پس از حذف واژه‌هاي نقش­نما و واژه‌هاي با يك بار فراواني و اشتقاقات صرفي، تعداد 3672 واژة معنادار به لحاظ موضوع، باقي ماند كه به يك ماتريس با 3672 ستون نياز دارد. به فرض این که تنها بيست و چهار جزء داده داشته باشيم، این به داده­هایی به شدت پراکنده منجر می­گردد که ابعاد آن باید تا حد امکان کاهش یابد تا با نیاز به نمایش متناسب با حوزة داده­ها هماهنگ گردد. براي اطلاع بيشتر دربارة روش­های کاهش بعد داده­ها، به ورليسن[13] مراجعه کنید. (2003) بدين منظور، پراكندگي همة 3672 ستونِ فراوانيِ ماتريس F محاسبه و به ترتيب درصد تغييراتي كه از واريانس تبیبن می­شود به صورت نزولي مرتب و روي نمودار زير نشان داده شده‌اند:alt

شكل2: نمودار پراكنش براي 3672 ستون

   اين همان چيزي است كه انتظار داريم توزيع فراواني واژة نمونه در متن زبان طبيعي از قانون زيپف پيروي كند. (مانینگ و شوتز، 1999: 26-20) تقريبا همة پراکندگی داده‌ها توسط مجموعه کوچک‌تری همانند پانصد بُعد یا کمتر قابل تبیین می‌باشد. درصدی از پراکندگی که توسط باقي مانده بُعدها تبیین می‌شود، آن قدر كم است كه نقش معناداري در تبیین واریانس نداشته و بنابراین می­توان آن را نادیده گرفت. بنابراين اين ماتريس به پانصد متغير/ ستون محدود شده كه به تحليل خوشه‌اي ماتريس  منجر مي‌شود.

3. تجزيه و تحليل

1-3. تحلیل خوشه‌اي سلسله مراتبي

   هدف تحليل خوشه‌اي آن است كه غير تصادفي بودن توزيع بُردارها را در یک فضایی از داده‌ها طوری مشخص نموده و به صورت نموداری نشان دهد که فاصلة بین گروه­ها ارتباط کمی با بُعد فضای داده‌ها داشته و فاصله درون گروهي همبستگی بزرگ­تری با بُعد فضای داده‌ها داشته باشد. اطلاعات مفصّل‌تري از آناليز خوشه‌اي سلسله مراتبي در اوریت (2002)،[14] گوردن (1999، 109-69)[15] و گوری (2000)[16] آمده است. براي بحث‌هاي كوتاه‌‌تر به اوریت و دون (2001،160- 125)،[17] هایر و همکاران (518،1998-469)،[18] فلاین و دیگران (9،1999-275)،[19] کاچیگان (70،1991-261)[20] و اُآکس (120،1998-110)[21] نگاه كنيد. تحليل خوشه‌اي، دو گونة اصلي دارد: سلسله مراتبي و غير سلسله مراتبي. هدف در اینجا تنها یافتن خوشه‌ها و نمایش آن‌ها به صورت نموداری نیست، بلكه همچنین ارتباطات اساسی ميان اجزاء داده‌ها و خوشه‌هاي اجزاء داده‌ها را با رسم درختواره ‌نگار[22] يا درخت‌ها باید نشان داد.

   آناليز خوشه‌اي سلسله مراتبي، تشابه ميان بردارها را به عنوان پايه‌اي براي خوشه‌بندي به كار مي‌برد، به طوري كه مي‌تواند نزديكي را تحت عنوان تشابه يا تفاوت (دوري) اندازه‌گيري نمايد. با درنظر گرفتن داده‌هاي اين تحقيق، نزديكي در واژه‌ها، يا واژه‌هاي مشابه يا واژه‌هاي غيرمشابه سنجيده مي‌شود؛ البته اغلب تمایز مورد سنجش واقع مي‌شود كه در اين جا نيز اين حالت انتخاب شده است. ساخت درخت خوشة مبتنی بر تمایز، براي ماتريس داده‌هايي كه مقدارهاي عددي دارند، مانند موردي كه در بالا توصيف شده، داراي دو مرحله است. در گام نخست، جدول تمایزهايِ ميان اجزاء داده‌ها، يعني ميان بُردارهاي سطری ماتريس داده‌ها، ساخته مي‌شود. اندازه به كار گرفته شده اغلب فاصله اقليدسي است؛ در اين روش، فاصلة ميان بردارهاي A و B بر اساس فرمول معروف زير محاسبه شده است:

alt

   اندازه­هاي بسيار ديگري در (1999،15-3) Gorden و (274،1999-271) Flynn و ديگران، وجود دارد.

   سپس در گام دوم، جدول تمایز، براي ساخت خوشه با الگوريتم عمومي زير، مورد استفاده قرار مي‌گيرد:

- نخست، هر بردار داده، تنها شامل خوشه خودش است (یعنی برای هر بردار از داده­ها یک خوشه داریم).

- انجام گام‌هاي بسياري لازم است، در هر گام، دو خوشه نزديك‌تر با يكديگر تركيب مي‌شوند تا يك خوشة مركب را شكل دهند، در نتيجه دو خوشه‌ به يك خوشه تبدیل می­شود.

- هنگامي كه تنها يك خوشه باقي ماند، همه نمونه‌ها را در ماتريس تمایز تركيب مي‌كنيم و متوقف مي‌شويم.

نمونة درخت توليد شده با اين روش، در بخش بعدي خواهد آمد.

2-3. تحليل خوشه‌اي داده‌هاي قرآني

   الگوريتم خوشه‌اي عامِ بالا بر يك نكتة مهم سرپوش مي‌گذارد: تعیین فاصله بین داده­ها توسط جدول تمایز، اما فاصلة ميان خوشه‌هاي مركب را روشن نمي‌كند و لازم است در هر گام، اين فاصله محاسبه شود. چگونه اين فاصله محاسبه مي‌شود؟ اين سؤال پاسخ ساده‌اي ندارد. تعاريف گوناگوني دربارة ساختن خوشه وجود دارد و در هر كاربرد خاصي، مجازيم كه يكي از آن تعاريف را انتخاب كنيم. مشكل اين است كه تركيب‌هايِ بي‌شمار معيار فاصله و تعاريف خوشه، سبب شده تا پژوهش گران، تحليل‌هاي متفاوتي از داده‌هاي يكسان ارائه دهند. در حال حاضر، ملاك دقيقي براي انتخاب معيار فاصله و تعريف خوشه وجود ندارد. در حقيقت، اين تعيين‌ناپذيري، مانع اصلي در استفاده از خوشه‌بنديِ سلسله مراتبی براي تحليل داده‌ها می­باشد. پژوهش حاضر، از كنار اين نكتة مهم عبور مي‌كند؛ زيرا هدفش روش‌شناختي است: قصد نداريم در اين مرحله از پژوهش، تحليل خوشه‌اي قطعي از قرآن كريم ارائه دهيم، بلكه قصد داريم رويكرد به انجام اين گونه مطالعات، را توسعه دهيم.[23] از اين رو، يك تركيب دقيق از معيار فاصله و تعريف خوشه به صورت تصادفي انتخاب شده و براي داده‌ها مورد استفاده قرار گرفته است که عبارتند از: مربع فاصلة اقليدسي و روش وارد.[24]

   نتايج به شرح زير می باشد (برچسب‌هاي A-D در سمت چپ، اشاره به مطلب بعدی دارند):

alt

شكل3: درخت ساخته شده بر اساس تحليل خوشه‌اي

3-3. تفسير

   با فرض اين كه طول‌ خطوط عمودي در بالاي درخت، فاصلة نسبي ميان زيرخوشه‌ها را نشان مي‌دهد، تفسير اين درخت بر حسب مناسبات سازه‌ايِ ميان سوره‌ها آشكار است: دو زيرخوشة اصلي A و B؛ A شامل دو زير خوشة C و D، و مانند آن زیر خوشه­های دیگر است. هر چند شناخت ساختار سازه‌ايِ سوره‌ها، پيش‌شرط لازم فهمِ ارتباطات موضوعي ميان سوره‌ها- هدفِ اين كاربرد- است اما كافي نيست، زيرا اين فهم، دربارة ويژگي‌هاي موضوعي خوشه‌ها و تفاوت‌هاي موضوعي ميان سوره‌ها و درون‌سوره‌ها، اطلاعاتي را به دست نمي‌دهد. اين اطلاعات مي‌تواند از معني‌شناسيِ واژه‌اي برچسب‌هاي ستون‌ها در ماتريس داده‌ها به صورتي كه در زير آمده، استنتاج شود.

   هر سطر در ماتريس داده‌ها، تصوير فراوانيِ واژه‌اي مترادف سوره است. از آن‌جا كه تحليل سلسله مراتبی، سطرهاي ماتريس داده‌ها را بر حسب فاصلة نسبي از يكديگر در فضاي داده‌ها خوشه‌بندي مي‌كند، چنين برمي‌آيد كه در مجموعة داده‌ها، تصاوير فراواني واژه‌اي در خوشة معينِ G ازهر تصوير ديگري، به يكديگر نزديكتر اند. تصاوير G مي‌تواند به وسيلة بُردار S خلاصه شود كه ابعاد داده‌ها است و هر عنصرش، ميانگين فراواني را براي ستون ماتريس داده‌هاي مشابه در بر دارد:

alt

   كه در اين جا  نشان دهنده  امين عنصر S، i نشان دهنده سطرهاي ماتريس داده‌هاي  و n تعداد كل سطرهای خوشه­ی  است. اگر S بر حسب معني‌شناسي بر چسب‌هاي ستون ماتريس تفسير شود، نمودار موضوعي‌اي براي G مي‌شود: وابسته به تغییرات فراواني s، فراواني زياد یک واژه نشان مي‌دهد كه اين سوره‌هايي كه G را تشكيل مي‌دهند، به معناي صريح آن واژه پرداخته‌اند و نشانة فراواني كمِ يك واژه، نقيض آن است. اين­گونه نمودار موضوعي، مي‌تواند براي هر زير‌ خوشه‌اي ساخته شود و تفاوت‌هاي موضوعي بين زيرخوشه‌ها مي‌تواند از مقايسه نمودارها به دست آيد.

   بنابراين فرايند رايج براي تفسير موضوعي درخت خوشه اين است كه ساختن و مقايسة نمودارهاي موضوعي براي زير‌خوشه‌ها در هر سطح، از سطوح بالايِ درخت تا پايين درخت تا آن‌جا كه مفيد به نظر مي‌آيد، انجام شود.

   به عنوان مثال، كاربرد اين فرايند رايج در زير ‌درختA  وB از خوشة بالا را در نظر بگیرید. دو بردار ميانگين فراواني، يكي براي اجزاء سوره‌هايِ خوشة A و يكي براي اجزاء سوره‌هاي خوشة B ساخته شده است. سپس هر يك نسبت به ديگري روي نمودار نشان داده شده است؛ خطِ تو پر با شکل مربع، خوشة A را نشان مي‌دهد و خطِ نقطه‌چين با شکل لوزي، خوشة B را نشان مي‌دهد؛ براي روشني، تنها پنجاه متغير با بالاترين واريانس به ترتيب نزولي از چپ نشان داده شده‌اند:

alt

شكل 4: نمودار ابتدايي گروه‌هاي A و B

   سوره‌هاي خوشة A به صورت برجسته‌اي با معناي صريح متغير1 - متغيرِ با بالاترين تبيين واريانس در قرآن كريم- ارتباط بيشتري نسبت به سوره‌هاي خوشة B دارند. اين متغيّر، واژة «الله» است كه در قلب اسلام قراردارد؛ تفاوت در فراوانيِ وقوع واژة «الله» در A و B، نخستين يافتة معنادار روش‌شناسي حاضر است.

   مقياس‌بندي متغيّر «الله» بر همة متغيّرهاي ديگر تسلط دارد. براي افزايش دقت و وضوح ساير متغيّرها، «الله» از بردارهايِ فراوانيِ واژه‌اي حذف شد و بردارها دوباره بر روي نمودار نشان داده شدند:

alt

شكل5: بازسازي نمودار گروه‌هاي A و B

   اطلاع از زمينة تاريخي از وحي قرآن كريم به حضرت محمد6 در اين مرحله از تفسير بسيار سخت است. سوره‌هايي كه به حضرت محمد6 پيش از هجرتش به مدينه نازل شده است، سوره­هاي «مكّي» ناميده مي‌شوند و سوره‌هاي پس از هجرتش به مدينه، «مدني» ناميده مي‌شوند. سوره‌هاي مكي بر يگانگي و عظمت «الله»، وعدة بهشت به درستكاران و هشدار عقاب به خطاكاران، تصديق پيامبري حضرت محمد6 و آمدن رستاخيز، يادآوري پيامبران گذشته و حوادث زمان آن پيامبران به مردم تأكيد دارند. از سوي ديگر، سوره‌هاي مدني، جنبه‌هاي رسمي اسلام، وضع قوانين و آداب اخلاقي و معنوي، حقوق جنايي، اجتماعي، اقتصادي و سياسي و رهنمودهاي ارتباطات خارجي و مقررات نبردها و اسراي جنگي را به تصوير مي‌كشند. اين نتايج، از موارد مشخص شده در خوشه­بنديِ ابتدايي در شكل 3. مانند تفاوت موضوعي، به دست آمده است. همة سوره‌ها در خوشة A سوره‌هاي مدني هستند (صرف نظر از سوره‌هاي «النحل» و «الزمر» كه سوره‌هاي مكي هستند؛ در عين حال اين سوره‌ها داراي آياتي هستند كه در مدينه نازل شده است). سيزده سوره‌اي كه خوشة B را تشكيل داده‌اند، همگي مدني هستند. توزيع متغيّرها (كليدواژه‌‌ها) در شكل 5 بسيار معنادار است مانند متغيّر 1 «قال» كه در سوره‌هاي خوشة B رايج است. سوره‌هاي اين گروه، قصه‌هاي زيادي دارند كه جنبه‌هاي مهمي از پيام قرآني، يادكرد پيامبران گذشته و نبردهاي­شان و تحكيم رسالت اسلامي حضرت محمد6 را شرح مي‌دهند. اين، حاكي از كاربرد فعل «قال» به عنوان يك واژة كليدي در سبك روايت است. متغير 4 «قل» (گفتن دستوري) بيشترين تكرار را در گروه B نسبت به گروه  A دارد. بيشترين نقل‌قول‌هاي سوره‌هاي مكي با واژة «قل» آغاز مي‌شود كه دستوري براي حضرت محمد6 است تا با واژه‌هاي پس از اين كلمه، شنوندگان­اش را در موقعيت خاص مانند پاسخ به سؤالي كه مطرح شده و يا يك حكم دربارة ذات ايمان، مورد خطاب قرار دهد. كاربرد اين واژه، با دعوت حضرت محمد6 به ايمان به خداوند و اسلام در سوره‌هاي مكي مناسب بود. متغير 5 «مؤمن»، متغير 8 «ايمان» و متغير 24 «تقوي»؛ در گروه A بسيار به كار رفته‌اند. سوره‌هاي مدني، سوره‌هايي هستند كه حضرت محمد6 در آن سوره‌ها، كساني را مورد خطاب قرار مي‌دهد كه پيش از اين به رسالت­اش ايمان آورده بودند و حال وقت آن بود كه به معرفي جنبه‌هاي اخلاقي و اجتماعي اسلام براي آنان بپردازد. ديگر متغيرهاي رايج در گروه B متغيرهاي 14 و 28 «آيات» و «آيه»اند. كاربرد اين دو واژه براي حضرت محمد6 در دورة اول اسلام در مكه خيلي مهم بود. او مجبور بود تا شاهد و نشانه‌اي به مردم ارائه دهد تا دعوت­اش به ايمان به خدا و اسلام را تأييد كنند.

   همان شيوة خوشه­بندي مي‌تواند براي زيرخوشه‌هايA  وB به كار رود، دوباره مقياس‌بندي «الله» كه بر ساير متغيرها تسلط دارد، از ميانگين بردارهاي فراواني حذف شود تا روشني بهتري براي متغيرهاي باقيمانده فراهم گردد. بردارهاي فراواني واژه‌اي براي C و D مثل حاصل زير، بر روي نمودار نشان داده شود:

alt

شكل6: نمودار گروه‌هايC  وD

نتايج شكل 6 پشتيبان ساختار موضوعي هر گروه هستند. سوره‌هاي گروه C بسيار فراوان از روايت و مخاطبْ ‌ساختن حضرت محمد6 استفاده كرده‌اند تا زمينه را براي اثبات رسالتش به مردم، فراهم سازند. سوره‌هاي گروه  Dبيشتر مؤمنان را به خاطر پاداش اعمال صالحشان، مورد خطاب قرار مي‌دهند. وقوع متغيرهاي نسبي در اين موضوعات، حاكي از چنين تفاوت‌هايي است.

4. نتيجه و پيشنهادها

   نتايج ابتداييِ بالا نشان مي‌دهد كه تركيب و تفسير معنايي درخت خوشه‌اي بر اساس فراواني واژه‌اي، رويكرد مفيدي براي كشف موضوعي ارتباطاتِ ميانْ ‌سوره‌‌ايِ قرآن كريم است. اما اين نتايج زماني قابل استفاده‌اند كه دو بحث اصلي حل شده باشد:

- استانداردسازيِ داده‌ها به خاطر اختلاف در طول سوره‌، همان‌گونه كه در بخش 3-2 بحث شد.

- اختلاف در ساختار درخت با تفاوت تركيب معيار فاصله و تعريف خوشه، همان‌گونه كه در بخش 2-3 بحث شد.

   پژوهش در موارد بالا، در حال پيشرفت است.

   در پايان بيفزاييم كه مشهور است كه آناليز خوشه‌اي سلسله مراتبي، به خاطر تفاوت معيار و تفاوت تركيب قواعد خوشه‌اي، نتايج گوناگوني را به دست مي‌دهد و در نتيجه نمي‌توان بر آن اعتماد كرد تا يك تحليل قاطع ارائه دهد. گام بعدي اين است كه ببينيم آيا تحليل مؤلفة اصلي ماتريس فراواني، نتايج سازگاري را با توجه به توصيفات بالا نتيجه مي‌دهد. روش چند متغيرة ديگري كه براي اين‌گونه داده‌ها به كار مي‌رود، مقياس­بندي چند بعدي است. در دراز مدت، هدف اين است تا با بهره‌گيري از روش‌هاي غيرخطي مانند نقشة خودسازنده، محاسبات غير خطي‌اي روي داده‌ها به دست دهد.

منابع

1. بازرگان، مهدی (1355)، سیر تحول قرآن، تهران: قلم.

2. جرار، بسام نهاد (1414)، اعجاز الرقم 19 تسعه عشر فی القرآن الکریم: مقدمات تنتظر النتائج، بیروت: الموسسه الاسلامیه.

3. جلالی نائینی، محمد رضا (1384)، تاریخ جمع قرآن کریم، تهران: نشر سخن.

4. دیدات، احمد (1381)، شبکه ریاضی قرآن: کشف سیستم حیرت انگیز ریاضی در قرآن، ترجمه ساسان حبیب وند، قزوین: نشر طه.

5. رفاعی، عدنان غازی (1421)، نظریه قرآنیه فی الاعجاز القرآنی: تعرض لاول مره فی العالم و نقد النظریه الاعجازیه فی القرآن الکریم، دمشق: دارالفکر.

6. روحانی، محمود (1368)، المعجم الاحصائی لالفاظ القرآن الکریم: فرهنگ آماری کلمات قرآن کریم، مشهد: موسسه چاپ و انتشارات آستان قدس رضوی.

7. سیوطی، جلال الدین (2000)، تناسق الدرر فی تناسب السور، تحقیق السید الجمیلی، بیروت: مکتبه الهلال.

8. صفوی، کورش (1379)، درآمدی بر معنی­شناسی، تهران: پژوهشگاه فرهنگ و هنر اسلامی/ انتشارات سوره مهر.

9. عمر، احمد مختار (1385)، معناشناسی، ترجمه سید حسین سیدی، مشهد: دانشگاه فردوسی مشهد.

10. نوفل، عبدالرزاق (1383)، الاعجاز العددی فی القرآن الکریم: معجزه اعداد در قرآن کریم، ترجمه سعید همایون، قم: بوستان کتاب قم.

11. الهی­زاده، محمد حسین (1391)، تدبّر میان سوره­ای (لوح فشرده)، مشهد: موسسه تدبر در قرآن و سیره.

12. یزدانی، عباس (1375)، اعجاز عددی و نظم ریاضی قرآن، کیهان اندیشه، شمارة 67، 84- 62.

 

1.Dror, J., Shaharabani, D., Talmon, R., Wintner, S.2004. Morphological Analysis of the Qur'an.

2 .Literary and Linguistic Computing, 19(4):431-452.

3 .Dunn, G. and Everitt, B. (2001).Applied MultivariateData Analysis, 2nd ed. Arnold, London.

4 .Everitt, B. (2001). Cluster Analysis, 4th ed. Arnold,London.

5 .Flynn, P., Jain, A., and Murty, M. (1999).Dataclustering: A review. In: ACM Computing Surveys31, 264–323.

6 .Gordon, A. (1999). Classification, 2nd ed. Chapman& Hall, London.

7 .Gore, P. (2000). Cluster Analysis. In H. E. A. Tinsley& S. D. Brown (Eds.), Handbook of applied

8 .multivariate statistics and mathematical modeling(pp. 297-321). Academic Press, San Diego, CA.

9 .Hair, H., Anderson, J., Black, W. and Tatham, R.(1998). Multivariate Data Analysis, 5th ed.Prentice-Hall International, London.

10 .Hand, D., Mannila, H., Smyth, P. (2001).Principles of Data Mining, MIT Press.

11.Kachigan, S .(1991) .Multivariate Statistical Analysis .A conceptual introduction. Radius Press, NewYork.

12 .Khalifa, Rashad,(1982), Quran Visual Presentation of the miracle, Arizona: Islamic Production.

13.Manning, C. and Schütze, H. (1999).Foundations of Statistical Natural Language Processing.Cambridge,Mass, MIT Press.

14.Oakes, M. (1998).Statistics for Corpus Linguistics.Edinburgh University Press, Edinburgh

15 .Thabet, N.(2004).“Stemming the Qur’an”.In Proceedings of Arabic Script-Based Languages Workshop, COLING-04, Switzerland, August 2004.

16.Verleysen, M. (2003).Learning high-dimensionaldata. In: Limitations and future trends in neuralcomputation. IOS Press, Amesterdam, pp141-162.



1. برای دستیابی به محتوای مفهومی واژه­ها، شاخص­های گوناگونی باید مد نظر قرار گیرد. در این میان، نخستین شاخص و یکی از شاخص­های کمّی در این ساحت که زیر­ساختی برای شاخص­های کیفی به شمار می­آید، بررسی فراوانی گونه‌های واژه‌هاست. (مترجم)

2. هم­چنان که مؤلف تأکید کرده، این روش، یک روش کاربردی است و نتایج آن نیز سمت و سوی کاربردی دارد. لذا نباید از این روش انتظار داشت که به دایره­ی روش­های بنیادی وارد شود. به دیگر سخن، این روش، زمینه را برای روش­های بنیادی فراهم می­کند و مقدمه­ای برای ورود به روش­های بنیادی به شمار می­آید. (م.)

1. در معنی­شناسی زبانی به آن گونه از معنی توجه می­شود که درون زبانی است و واحدهای مطالعه­ی این نوع معنی نیز واژه و جمله به حساب می­آیند (صفوی، 1379، 46). (م.)

2. هر چند این نکته در جای خود درست است، اما در میراث ماندگار دانش تفسیر، قراینی وجود دارد که نشان می­دهد دانشمندان اسلامی از توجه به بحث­های آماری در قرآن کریم غفلت نورزیده­اند. دانش «وجوه و نظائر»، روش «تفسیر قرآن به قرآن»، «فرهنگ­های تخصصی قرآن کریم»، بررسی و نقد آراء مذاهب گوناگون درباره­ی برداشت­های مختلف از آیات قرآن کریم و ذکر دقایق و ظرایف عرفا در تفسیر عرفانی قرآن کریم، همگی شاهدی بر این مدعا است. قرآن­پژوهان برای ورود به این بحث­ها از آمارهای قرآنی به عنوان زمینه و مقدمه­ی اثبات دیدگاه خویش بهره می­برده­اند؛ هر چند این آمارها به دقت و جامعیّت امروزی نبوده و نیز تنها با استفاده از روش های آمار توصیفی انجام گرفته است. در این مقاله نویسنده محترم با استفاده از روش­های آمار استنباطی توام با آمار توصیفی نتایج ملموس و جالبی بدست آورده است. (م.)

3. اگر نویسنده­ی محترم به جای جمله «تقریباً ...» از عبارت «در حوزه­ی مطالعات تحليل آماری قرآن كريم، كارهای اندکی انجام شده است» استفاده می­کرد، به صواب نزدیک­تر بود. زیرا در ساحت تحلیل آماری قرآن کریم، پژوهش­های قابل توجهی در دهه­های اخیر توسط دانشمندان مسلمان انجام گرفته است که برخی از آن­ها عبارت است از: روحانی (1368)؛ بازرگان (1355)؛ Khalifa(1982)؛ رفاعی (1421)؛ جرار (1414)؛ دیدات (1381) و نوفل (1383). برای نقدهای اعجاز عددی و آثار اخیر ر. ک. : یزدانی، 1375، 84- 62. (م.)

1. منظور نویسنده این است که در تحلیل­های آماری واژه­های قرآن کریم تاکنون تنها روش­های آمار توصیفی همانند جداول فراوانی، شاخص­های آماری تمایل مرکزی و پراکندگی (همانند میانگین و... و واریانس و ...) و نمودارهای آماری بکار گرفته شده است و به کاربرد بردن روش­های آمار استنباطی همانند مقایسه­های شاخص­ها و بخصوص روش­های مدل­سازی و خوشه­بندی و ... یا اصلا استفاده نشده یا کمتر مورد اقبال بوده است.

2. با توجه به رشته­ی تخصصی نویسنده­ی محترم که زبانشناسی است، طبیعی است که اطلاعات او درباره­ی مباحث قرآنی کم باشد. اما هر پژوهشگری باید اطلاعات خود را نه تنها در ساحتی که پژوهش می­کند؛ بلکه در حوزه­های میان­رشته­ای مربوط به پژوهش خود نیز تقویت کند تا بر استحکام، قوت و ارزش علمی کار پژوهشی خویش بیفزاید. دانشمندان اسلامی درباره­ی ترتیب سوره­ها در قرآن کریم در طول هزار و چهار صد سال گذشته بسیار بحث کرده­اند و نظریات گوناگونی نیز در این زمینه ارائه داده­اند. این نظریات در سه دسته­ی کلی قابل تقسیم است: توقیفی بودن ترتیب سوره­ها، اجتهادی بودن ترتیب سوره­ها، قول به تفصیل که چینش عمده­ی سور را توقیفی می­داند و اجتهاد و نظر صحابه را تنها در تنظیم چند سوره، دخیل معرفی می­کند. در میان این دیدگاه­ها، دیدگاه تفصیلی از اعتبار بیشتری برخوردار است و مستندات آن نسبت به سایر دیدگاه­ها از قوت بیشتری برخوردار است. (جلالی نائینی 1384، 156-153) بر اساس پذیرش دیدگاه نخست و سوم، بحث تناسب میان سور قرآن کریم برجسته می­شود. قرآن­پژوهان و مفسّران در آثار و تفاسیر خود، در انتها و ابتدایِ هر سوره، بیشتر به ارتباط میان دو سوره­ای که در کنار یکدیگر قرار گرفته­اند، پرداخته­اند و کمتر به ارتباط میان سوره­های قرآن کریم به عنوان یک مجموعه­ی منسجم پرداخته­اند. هر چند در این مورد نیز آثاری پدید آمده است که عبارتند از: سیوطی (2000) و الهی­زاده (1391). (م)

1. در اصل مقاله، پنج آمده است که ظاهراً در ویرایش نهایی نویسنده­ی محترم تصحیح نشده است. (م.)

2. مهم­ترین استاندارد برای نمایش حروف، اعداد و علائم در نرم­افزارهای رایانه­ای است. (م.)

[10]. Manning & Shütze.

1. نویسنده­ی محترم معتقد است که دو اختلاف بالا در مورد قرآن کریم، به دلیل ساختار زبان عربی و رسم الخط قرآن کریم وجود ندارد و یا دست کم قابل توجّه نیست؛ اما مشکلات دیگری درباره­ی قرآن کریم بروز می­کند که پرداختن به آن­ها به عنوان مبانی نظری روش­شناسیِ پیشنهاد شده ضروری است که متأسفانه در متن مقاله نیامده است. برخی از این نکات عبارتند از: 1. بی­توجهی به بافت­های گوناگون زبانی واژه­های قرآن کریم: روشن است که هر واژه­ای در بافتی قرار دارد که بخش قابل توجهی از معنای خود را مرهون بافتی است که در آن قرار گرفته است. بدون توجه به بافت هر واژه، نمی­توان معنای دقیقِ آن واژه را به دست آورد، زیرا یک واژه در دو بافت گوناگون، دو معنای متفاوت دارد. این در حالی است که در این روش­شناسی، برای بررسی ارتباطات میان سوره­های قرآن کریم، تنها به فراوانی کاربردهای واژه­ها در سوره­ها- بدون بررسی بافت هر واژه و در نتیجه معنای هر واژه- توجّه شده است. این گونه پژوهش­ها به دلیل تداخل معانی واژه­ها، از روایی (validity) لازم برخوردار نیستند. این نقیصه از جمله مواردی است که نویسنده­ی این نوشتار باید پاسخ قانع­کننده­ای برای آن ارائه می­کرد.

 2. بی­توجهی به واژه­های ترکیبی: در زبان عربی همانند هر زبانی، انبوهی از واژه­ها به صورت ترکیبی به کار می­روند. مثلاً واژه­ی «ضرب» با ترکیب با واژه­هایِ (الامثال، الارض، ...) معانی متفاوتی پیدا می­کند (ر.ک: عمر، 1385، 146)، که در صورت شمارش جداگانه­ی واژه­ها، از یک سو این معانی در داده­های آماری راه پیدا نمی­کنند و از سوی دیگر، آن چیزی مورد سنجش قرار می­گیرد که واقعیّت ندارد. به دیگر سخن، پژوهش­هایی که بر پایه­یِ این روش­شناسی انجام می­شود، از روایی بالایی برخوردار نخواهند بود. این هم نکته­ای است که نویسنده­ی محترم مقاله پاسخی برای حل آن ارائه نکرده است. 3. بی­توجّهی به واژه­های چند معنا: در زبان عربی و به ویژه در قرآن کریم، واژه­هایی به کار رفته که چند معنا دارند. دانش «وجوه و نظائر»   ← برای بحث درباره­ی این واژه­ها در قرآن کریم توسط لغت­شناسان مسلمان بنیان نهاده شده است و آثار متعددی در این زمینه به رشته­ی تحریر درآمده است. در این دانش از واژه­هایی مانند «یوم» که در آیات گوناگون، معانی مختلفی دارد، بحث می­شود. اگر تنها به فراوانی یک واژه- بدون توجّه به معانی متفاوت آن- اکتفا کنیم، دست­کم نتایج این گونه تحلیل­ها در مورد قرآن کریم صادق نخواهد بود. زیرا این گونه واژه­ها-که تعداد آن­ها در قرآن کریم نیز بسیار است- در سوره­های گوناگون، معانی متفاوتی دارند، در صورتی که در این گونه تحلیل­ها، این تفاوت­ها مد نظر قرار نمی­گیرد و بر پایه­ی آن، نتایج به دست آمده با آن­چه در قرآن کریم وجود دارد، فاصله خواهد داشت. از این رو، شایسته بود نویسنده­ی محترم در خصوص رفع این مشکلات، راه کارهایی روش­شناسانه ارائه دهد. نکات دیگری نیز در این­باره قابل طرح است که به دلیل اختصار از ذکر آن­ها خودداری می­شود. (م.) 

1. نویسنده­ی محترم در این­جا به برخی از کاستی­های این روش- دست کم برای ارتباطات متقابل موضوعی میان سوره­های بزرگ و کوچک - اذعان کرده است. (م.)

1.Verleysen.

[14]. Everitt.

[15]. Gordon.

[16]. Gore.

[17]. Dunn & Everitt.

[18]. Hair.

[19]. Flynn.

[20]. Kachigan.

[21]. Oakes.

[22]. Dendrogram.

1. روشن است که روی کرد به انجام این گونه مطالعات هنگامی توسعه پیدا می­کند که نتایج آن قطعی و یا نزدیک به قطعی باشد، زیرا تحلیل­های متفاوت از داده­های یکسان، به جای آن­که به مفسّر کمک کند و او را راهنمایی کند و سنگی را از سر راه مفسّر بردارد، مفسّر را در میان تحلیل­های گوناگون سرگردان می­سازد و بر سر راه او سنگ می­نهد. البته ناگفته نماند که تحلیل­های گوناگون هم­چنان که مضراتی دارد، فایده­ای هم دارد و آن­ این­که این ­گونه تحلیل­ها، ذهن مفسّر را نسبت به تفاسیر و برداشت­های گوناگون از قرآن کریم نیز شکوفا می­کند. (م)

   نیز نویسنده این قسمت را بخوبی بیان نکرده و این ابهام بوجود آمده است که تغییر معیار تمایز (یا ماتریس تشابه) و تعریف خوشه می­تواند نتیجه را تغییر دهد. البته این موضوع کاملا درست است. اما چون روش­های آماری به صورت کلی و عمومی می­باشند که در همه امور کاربرد داشته باشند، این جزء خصوصیات این روش­ها است. لذا محقق بایستی با توجه به موضوع و هدف مطالعه بهترین ماتریس تشابه یا تمایز یا معیار فاصله را انتخاب نموده و همچنین خوشه را نیز با توجه به هدف و موضوع برگزیند. در این صورت هر روش دیگری مبتنی بر واقعیت نخواهد بود. (م)

 

[24]. Ward.

 

آخرین بروز رسانی مطلب در پنجشنبه ، 20 دی 1397 ، 10:06
 

خبرنامه

نــــام:

ایمیل: