[do_widget id=kl-erq-2]

1- تحقیق بنیادی: هدف اساسی این نوع تحقیقات آزمون نظریه‌ها ، تبیین روابط بین پدیده‌ها و افزودن به مجموعه دانش موجود در یک زمینه خاص است . تحقیقات بنیادی ،نظریه‌ها را بررسی کرده ،آن‌ها را تایید ،تعدیل یا رد می‌کند . با تبیین روابط میان پدیده‌ها ،تحقیق بنیادی به کشف قوانین و اصول علمی می‌پردازد . با این اهداف ، تحقیقات بنیادی درصدد توسعه مجموع دانسته‌های موجود درباره اصول و قوانین علمی است. این نوع تحقیقات نتیجه گرا بوده و در رابطه با نیازهای تصمیم گیری انجام نمی‌شود برای مثال تحول استدلال منطقی نزد کودکان را می‌توان از نوع تحقیقات بنیادی دانست[4,5].
2- تحقیق و توسعه: فرایندی است که به منظور تدوین و تشخیص مناسب بودن یک فرایند ، روش‌ها و برنامه‌های، شناسایی نیاز یا استعداد، پیدایش اندیشه‌ها ،آفرینش طراحی ،تولید ، معرفی و انتشار یک محصول و فرایند یا نظام فناوری تازه، انجام می‌شود. هدف اصلی فعالیت‌های R&Dنظریه پردازی یا آزمون نظریه نیست بلکه توسعه محصولات یا فرایندهای جدید، تدوین یا تهیه برنامه‌ها ، طرح‌ها و امثال آن است. به طوری که ابتدا موقعیت نامعین خاصی مشخص شده و بر اساس یافته‌های پژوهشی ، طرح یا برنامه ویژه آن تدوین و تولید می‌شود[4,5].
3-تحقیق کاربردی: هدف تحقیقات کاربردی توسعه دانش کاربردی در یک زمینه خاص است .به عبارت دیگر تحقیقات کاربردی به سمت کاربرد عملی دانش هدایت می‌شود . نتایج این نوع تحقیقات در تعلیم و تربیت مثلاً در طراحی برنامه‌های درسی و کمک به اتخاذ تصمیم‌های مربوط به نظام آموزشی به کار می‌رود . به عنوان مثال کاربرد نظریه‌های مربوط به فرا شناخت در حل مسأله را می‌توان در زمره تحقیقات کاربردی قرار داد[4]. روش این مقاله کاربردی است.
3-2-2 بر اساس نحوه گردآوری داده‌ها(تحقیق توصیفی):
تحقیق توصیفی شامل مجموعه روش‌هایی است که هدف آن‌ها توصیف کردن شرایط یا پدیده‌های مورد بررسی است. اجرای تحقیق توصیفی می‌تواند صرفاً برای شناخت شرایط موجود یا یاری دادن به فرایند تصمیم گیری باشد [4].
بیشتر تحقیقات علوم رفتاری را می‌توان در زمره تحقیق توصیفی به شمار آورد[4]
که بر اساس این تقسیم‌بندی پنج نوع تحقیق را می‌توان نام برد :
تحقیق پیمایشی
تحقیق همبستگی
اقدام پژوهی
بررسی موردی
تحقیق پس رویدادی
1-روش پیمایشی:
در این پژوهش توجه محقق بیشتر به شناخت و مطالعه میزان تغییرات عوامل .اثر معنی داری کنش و واکنش‌ها میان عوامل معطوف می‌باشد لذا این روش برای بررسی میزان تغییرات یک یا چند عامل در اثر تغییرات یک یا چند عامل دیگر بکار می‌رود.
انواع روش پیمایشی
پیمایش توصیفی (پیمایش‌های آماری )
بررسی تمام افراد جامعه (سرشماری ) یا معرفی از جمعیت نمونه و تعمیم نتایج به کل جامعه آماری.
پیمایش تحلیلی (پیمایش‌های ربطی)
شامل بررسی و تجزیه و تحلیل روابط بین متغیرهای معین .جهت بیان خصوصیات معرف گروه مطالعه است.
2- تحقیق همبستگی
در این تحقیق تحلیل رابطه میان متغیرها بر اساس هدف تحقیق مورد بررسی قرار می‌گیرد که تحلیل رابطه میان متغیر شامل:
مطالعه همبستگی دو متغیری
تحلیل رگرسیون با هدف پیش بینی تغییرات یک یا چند متغیر وابسته با توجه به تغییرات متغیرهای مستقل
تحلیل ماتریس همبستگی با هدف بررسی مجموعه‌ای از همبستگی‌های دو متغیری در جدولی بنام ماتریس.
3-تحقیق در عملیات یا اقدام پژوهی:

[do_widget id=kl-erq-2]

این مرحله وظیفه آسانی نیست. این مرحله شامل شناسایی دانش، ارائه دانش در قالبی مناسب، ساختاردهی دانش و انتقال دانش به ماشین است. فرایند کشف دانش می‌تواند به وسیله نقش‌های شرکت‌کنندگان مهم به صورت وسیع تحت تأثیر قرار گیرد: مهندس دانش، خبره، کاربر نهایی.
مهندس دانش باید به عنوان معلم ساختار دانش، طراح ابزار و سازمان دهنده و واسط بین خبره و کاربر نهایی عمل کند.
توانایی و شخصیت مهندسی دانش به طور مستقیم خبره را تحت تأثیر قرار می‌دهد. بخش موفقیت آمیز کشف دانش توسعه رابطه مثبت با خبره است. مهندس دانش باید پاسخگوی ایجاد اثر مثبت، اطلاعات ارتباطی مثبت درباره پروژه، فهمیدن سلیقه خبره‌ها، تدارک جلسات و… است. در بعضی از پروژه‌های سیستم خبره از خبره‌های متعدد استفاده می‌شود که معمولاً این کار به دلایل زیر انجام می‌شود:
درک بهتر دامنه دانش
برای بهبود ارزیابی، سازگاری، دقت، جامعیت و ارتباط دانش
برای مهیا کردن سودمندی بیشتر
برای شناسایی آسان نتایج نادرست
….
علاوه بر اینکه از خبره‌های متعددی کمک گرفته می‌شود از منابع متعدد نیز استفاده می‌کنند از جمله کتاب، مقالات، گزارشات و …
برای سرعت بخشیدن به فرایند کشف دانش از نرم‌افزارهای کامپیوتری برای کشف دانش از اسناد داده‌ای استفاده می‌کنند. دلایل استفاده از کشف دانش خودکار را می‌توان به صورت زیر بیان کرد:
برای افزایش سودمندی مهندسی دانش (کاهش هزینه)
برای کاهش سطح مهارت مورد نیاز برای مهندس دانش
برای حذف نیاز به خبره (یا کاهش زیاد آن)
برای حذف نیاز به مهندس دانش (یا کاهش آن)
برای افزایش کیفیت دانش اکتسابی
برای سیستم‌های خبره مبتنی بر قانون، از متدی قدیمی با استفاده از متد استنتاجی در یادگیری ماشین استفاده می‌شود. دانش ممکن است از اسناد کشف شود که این در واقع همان کاوش متن است که می‌تواند در کشف دانش از متن‌های غیر ساختار یافته مفید باشد. کشف از منبع مستندسازی شده پتانسیل قوی برای اتوماسیون است. دانش مستندسازی شده در هر نوع می‌تواند به سادگی و ارزانی اسکن شود و به پایگاه داده کامپیوتری تبدیل شود. دانش می‌تواند سپس با استفاده از تکنولوژی‌های هوش مصنوعی تحلیل شود. در واقع سیستم خبره می‌تواند برای ساخت سیستم خبره دیگری مورد استفاده قرار گیرد. توانایی ساخت سیستم خبره که بتواند پایگاه داده‌ها، کتاب‌های الکترونیکی، ژورنال‌ها و مجله‌ها را اسکن کند در حال افزایش است. داده‌های ذخیره شده در کامپیوتر دیگر می‌تواند به صورت الکترونیکی بازیابی شده و برای ایجاد و به‌روزرسانی پایگاه دانش سیستم خبره بدون نیاز به فرد خبره یا مهندس دانش مورد استفاده قرار گیرد. متدهایی برای تفسیر معانی به منظور تشخیص قوانین توسعه پیدا کرده‌اند[19]. هدف این تحقیق ارائه روشی با استفاده از رویکرد کاوش ایده برای این مرحله از مهندسی فرایند دانش است.
فصل سوم : روش تحقیق
3-1 مقدمه
پایه و اساس تولید علم، تحقیق است. از طرفی تحقیق بستر اصلی برای درک عمیق و دقیق از حقایق، تفکر و اندیشه می‌باشد. در این میان انتخاب روش صحیح و متناسب با اهداف پژوهش و به کار بردن ابزار همسو با آن، در اثر بخشی و صحت نتایج هر پژوهش دارای اهمیت است[1]. چنانچه روش متناسبی با موضوع پژوهش انتخاب شود، کار تحقیق سریع‌تر و مطمئن‌تر انجام می‌شود.
روش تحقیق همانند ابزارهای متفاوت در جعبه ابزار است که محقق متناسب با تحقیق خود باید آن را به کار ببرد [2]. روش تحقیق در واقع راه رسیدن به مطلوب یا کشف واقعیت آن گونه که هست را نشان می‌دهد. و نیز روش تحقیق به کلیه تدابیر، ابزار و فنون برای کشف حقیقت گفته می‌شود [3] . به عبارت دیگر،روش تحقیق چارچوب عملیات یا اقدامات جستجوگرانه برای تحقق هدف پژوهش،جهت آزمون فرضیه یا پاسخ دادن به سوال‌های تحقیق را فراهم می‌آورد [4].
در این فصل از تحقیق، روش پژوهش، روش گردآوری داده‌ها و روش تجزیه و تحلیل اطلاعات تشریح می‌شود.
3-2 روش تحقیق
معمولاً روش‌های تحقیق از منظرهای مختلفی دسته بندی می‌شوند. در اینجا دو نوع دسته‌بندی بر اساس هدف تحقیق و بر اساس نحوه گرداوری داده بیان می‌شود.
3-2-1 بر اساس هدف تحقیق
بر اساس هدف تحقیق روش‌های تحقیق به سه دسته تقسیم می‌شوند:
[do_widget id=kl-erq-2]

پایگاه دانش: باید دانش از منابع استخراج شود و در این پایگاه قرار می‌گیرد(روش ارائه منطقی).
شکل 3-2 : ساختار سیستم خبره
مهندس دانش: سازنده سیستم خبره است که باید روش ثبت و نگه‌داری علوم و اطلاعات را در کامپیوتر مشخص کند.
مهندسی دانش: به مراحل ساخت یک سیستم خبره مهندسی دانش گفته می‌شود.
2-7-2 توسعه سیستم‌های خبره
قبل از بررسی توسعه سیستم‌های خبره نیاز داریم که مفاهیمی را بدانیم که عبارتند از:
کشف دانش: فرایند جمع‌آوری دانش برای ذخیره در پایگاه دانش است که اثبات شده مشکل‌ترین کامپوننت در فرایند مهندسی دانش است. در واقع به عنوان گلوگاه کشف دانش شناخته می‌شود و پروژه‌های سیستم‌های خبره بیشتر در این مرحله با شکست مواجه می‌شوند.
دامنه خبره: کشف دانش اغلب شامل استخراج دانش از کسانی است که در آن فیلد متخصص هستند.
استنباط دانش: فرایندی که شامل تکنیک‌های مصاحبه‌ای و غیر مصاحبه‌ای متعدد است.
پروژه سیستم‌های خبره به رویکردهای مخصوص برای مدیریت نرم‌افزار احتیاج دارد. متدلوژی‌های به کار رفته برای ساخت سیستم‌های خبره با مسأله در کشف دانش مواجه می‌شوند. در ادامه فرایند مهندسی دانش که برای طراحی سیستم‌های خبره مورد استفاده قرار می‌گیرد را شرح می‌دهیم.
2-7-3 فرایند مهندسی دانش
فرایند کشف دانش از خبره‌ها و ساختن پایگاه دانش، مهندسی دانش نامیده می‌شود. هدف مهندسی دانش شبیه مهندس نرم‌افزار است: تبدیل کردن فرایند ساختن سیستم پایگاه دانش از قالب هنر به دیسیپلین مهندسی است. این کار نیازمند آنالیز فرایند ساختاری خودش و توسعه متدها، زبان‌ها و ابزاری مناسب و خاص برای توسعه سیستم پایگاه دانش است [20]. مهندسی دانش شامل همکاری خبره‌ها در دامنه کاری با مهندس دانش است تا قوانین ضمنی ساخته و کد شوند که افراد خبره از آن در حل مسائل واقعی استفاده می‌کنند. که این رشته به مهندسی نرم‌افزار مربوط است [19]. توسعه سیستم‌های پایگاه دانش فرایندی انتقالی از دانش بشر به پیاده‌سازی پایگاه دانش است. این انتقال بر اساس این فرضیه استوار است که دانش مورد نیاز سیستم KBS در حال حاضر موجود است و فقط باید جمع‌آوری و پیاده‌سازی شود. دانش مورد نیاز معمولاً از طریق خبره‌ها که چگونه آن‌ها وظایف خاص را حل می‌کنند بدست می‌آید [20].
به مهندسی دانش از دو دیدگاه می‌توان نگریست: محدود و وسیع. از دیدگاه محدود مهندسی دانش با کسب، ارائه، ارزیابی، استنتاج، تفسیر و نگه‌داری دانش سروکار دارد. در عوض، بر اساس دیدگاه وسیع، این اصطلاح تمام فرایند توسعه و نگه‌داری سیستم‌های هوشمند را توضیح می‌دهد.
دانش استفاده‌شده توسط افراد خبره اغلب غیر ساختار یافته و غیر صریح است. هدف اصلی مهندسی دانش کمک به خبره‌ها است که آنچه را که می‌دانند به صورت ماهرانه بیان کنند و اینکه دانش را در قالبی قابل استفاده و درک مستندسازی کنند [19].
2-7-4 مراحل فرایند مهندسی دانش
فرایند مهندسی دانش شامل 5 فعالیت اصلی است:
کشف دانش. کشف دانش شامل کشف دانش از افراد خبره، کتاب‌ها، اسناد، حسگرها و کامپیوترها است. دانش ممکن است در حوزه مسأله یا در روال‌های حل مسأله تشخیص داده شود، که ممکن است دانش کلی باشد (دانش درباره کسب و کار (یا ابر دانش (دانش درباره دانش) باشد. بیرد به صورت فرمال ارزیابی کرد که کشف دانش گلوگاه در توسعه سیستم‌های خبره امروزی است. بنابراین تحقیقات تئوری بیشتری دی این زمینه هنوز هم هدایت می‌شود.
ارائه دانش: دانش اکتسابی سازماندهی می‌شود بنابراین در فعالیتی به نام ارائه دانش برای استفاده آماده است. این فعالیت شامل آماده‌سازی نقشه دانش و رمزگذاری دانش در پایگاه دانش است.
ارزیابی دانش: ارزیابی دانش شامل اعتبار سنجی و ارزیابی دانش است تا زمانی که کیفیت آن قابل قبول باشد. برای تست، نتایج اغلب به حوزه خبره نشان داده می‌شود تا میزان دقت سیستم خبره ارزیابی شود.
استنتاج: این فعالیت شامل طراحی نرم‌افزار برای قادر ساختن کامپیوتر جهت ساخت استنتاج بر اساس دانش ذخیره شده و مسئله خاص است. این سیستم می‌تواند برای کاربران غیر خبره پیشنهاداتی مهیا کند.
تفسیر و توجیه: این مرحله شامل طراحی، برنامه‌نویسی توانایی تفسیر است (برنامه‌نویسی توانایی جواب دادن به سوالات به عنوان نمونه چرا یک قطعه خاص اطلاعات به وسیله کامپیوتر مورد نیاز است و یا حتی چگونه نتیجه حتمی توسط کامپیوتر اخذ می‌گردد).
شکل 4-2 فرایند مهندسی دانش و ارتباطات فعالیت‌های مهندسی دانش را نشان می‌دهد.
شکل 4-2 : فرایند مهندسی دانش
چون هدف ما کاربرد روش کاوش ایده در مرحله کشف دانش است در بخش بعدی این مرحله به صورت کامل‌تر مورد بحث قرار می‌گیرد[19].
2-7-5 مرحله کشف دانش

[do_widget id=kl-erq-2]

شکل 2-2: چارچوب نوآوری- معماری سیستم
این مقاله مدل فرایندی را بیان می‌کند که فعالیت‌های نوآوری را به 5 عملکرد اصلی گروه‌بندی می‌کند که برای توسعه سرویس‌های نوآوری جدید لازم هستند. بنابراین چارچوبی نوآورانه به وسیله هم تراز کردن معماری سیستم نوآورانه با فرایند نوآورانه مطرح کردند. در این چهار چوب در مرحله اول با استفاده از ابزار کاوش ایده، ایده‌های جدید خلق و توسعه داده می‌شوند و با استفاده از رویکردهای اطلاعاتی مبتنی بر بازار مورد ارزیابی قرار می‌گیرند. اگر نتایج ارزیابی شده مثبت باشند، ایده پیاده‌سازی می‌شود و مورد استفاده قرار می‌گیرد. اطلاعات سرویس جدید در اشکال مختلف تغییر و بهبود در سرویس‌های موجود را با استفاده از یک کنترل‌کننده بازخورد موجب می‌شوند.
یک جزء مرکزی در چارچوب مذکور به عنوان منبع نوآوری وجود دارد که وسیله‌ای برای ذخیره و بازیابی ایده‌ها فراهم می‌کند و به صورت سیستمی آن‌ها را با اطلاعات اضافی تسهیل می‌کند. تمام ابزارها در این چارچوب به وسیله این منبع در نهایت پشتیبانی می‌شوند که بدین گونه، به عنوان انبار ایده یکنواخت عمل می‌کند و داده‌های تولید شده در اجزای مربوطه را یکپارچه می‌کند. تمام اطلاعات ایجاد شده در فعالیت‌های ایجاد، ارزیابی و… و در منبع نوآوری جمع می‌شود. ایده‌هایی که مثبت ارزیابی می‌شوند بهترین کاندیدا برای تحقق پیدا کردن هستند و به صورت سرویس پیاده‌سازی خواهند شد و در نهایت خود این سرویس‌ها که پایه ایجاد آن ایده مفید و جدیدی بوده نیز مورد ارزیابی قرار خواهد گرفت. در صورتی که ارزیابی مثبت باشد در نهایت به جای سرویس‌های موجود و یا در کنار آن‌ها استفاده می‌شود یا با تغییری در سرویس‌های موجود همراه خواهد بود[9].
2-6-2 کاوش ایده برای پشتیبانی از توسعه و تحقیقات درباره محصول جدید
عکسالعمل سریع در مقابل نیازممندیهای متغییر مشتریان گرداننده کلیدی برای موفقیت کسب و کار است. افزایش مشتری مداری فرصتهای گسترش حرکت رو به جلو وب 2 را به ارمغان آورده است تا آنچه که مشتریان میخواهند و انچه که آنها نمیخواهند را پیدا کنند. سازمان‌های مختلف امروزه به دنبال پیدا کردن نیازهای مشتریان خود هستند و اکثر اوقات از کاربرانی برای انجام آن استفاده می‌کنند تا اینترنت و وبلاگ‌ها را به منظور پیدا کردن نیازهای مشتری جستجو کنند. جنبه مهم در این رویکرد این است که مشتریان ایده‌های محصول جدید را در وبلاگ‌هایشان به وسیله استفاده از زبان محاوره‌ای می‌نویسند. یافتن ایده‌های محصول جدید کاری شناخته شده در بازاریابی است. رویکرد کاوش وبلاگ‌ها هدفش پشتیبانی از کاربران برای یافتن ایده‌های محصول جدید از وبلاگ است. این رویکرد شامل مراحل زیر است: در مرحله اول کاربر باید توضیحات محصول خود را فراهم نماید. مثلاً توضیحات محصولات موجود در دسترس هستند زیرا اشخاص از بخش‌های بازاریابی سازمان از آن‌ها برای اهداف بازاریابی استفاده می‌کنند حتی می‌توانند درباره آینده محصول توضیح دهند. در این مرحله روی توضیحات مرحله پیش پردازش انجام می‌شود (جدا کردن اصطلاحات، حذف کلمات عمومی و …). در مرحله بعد بردارهای متنی بر اساس وزن و طولی که کاربر می‌دهد ساخته می‌شوند. سپس از وبلاگ‌های مشتریان نیز بردارهای متنی استخراج می‌شود و با بردارهای توضیحات کاربر بر اساس روش کاوش ایده مقایسه می‌شوند. در نهایت ایده‌های محصول جدید از آن‌ها استخراج می‌شود. این برنامه در قالب وب سرویس اجرا می‌شود و برای اینکه نتایج بهتری را بدهد بهتر است که طول جملات متنی که کاربر در آن محصول را توضیح می‌دهد کوتاه باشد تا این روش هم از لحاظ سرعت و هم از لحاظ کارایی مفید واقع شود [10,11].
2-7 سیستم‌های خبره
سیستمهای خبره با سیستمهای هوشمصنوعی رشد کرده و به عنوان شاخهای از هوش مصنوعی در نظر گرفته میشوند. استفاده از سیستمهای خبره در دهههای اخیر خصوصاً در زمینه پزشکی و تصمیم گیری‌های غیرقطعی به شدت افزایش پیدا کرده است و لذا توجه به توسعه چنین سیستمهایی از این لحاظ که از بنیان با سیستمهای معمولی فرق دارد و با مفهومی به نام دانش که بسیار متفاوت از داده است سروکار دارد در حال گسترش است. تعریف‌های مختلفی از دانشمندان مختلف در حوزه سیستم‌های خبره برای سیستم خبره وجود دارد دو مورد از اصلی‌ترین آن‌ها عبارت است از:
به عقیده دارلینگتن سیستم خبره برنامه‌ای است که تلاش می‌کند خبرگی انسان را به وسیله اعمال متدهای استنتاجی روی پیکره دانش تقلید کند.
به عقیده توربان سیستم خبره سیستمی است که دانش انسان را به کار می‌برد و آن را در کامپیوتر به منظور حل مسائلی که عموماً به خبرگی انسان نیاز دارد کپچر می‌کند.
در ابتدا در حالت کلی تلاش برای ساخت سیستم‌های هوشمند بود. در سال 1960 آلن نیول و هربرت سیمون یک برنامه کامپیوتری برای تست فرضیه‌هایی که رفتار هوشمند از جستجوی غیرقطعی نتیجه می‌گیرد را نوشتند. جی‌پی‌اس نتیجه قوانین کلی دریافت شده از حل مسائل هوش است. به زودی به این نتیجه رسیدند که راه ساختن پیشرفت، تمرکز روی دامنه برنامه خاص است و سیستم‌های خبره کم کم ظاهر شدند. اولین سیستم‌های خبره که توسعه پیدا کردند عبارتند از:
دندرال: که در سال 1960 توسعه پیدا کرد و کار آن تحلیل ساختار شیمیایی بود. با استفاده از اطلاعات مربوط به یک ماده و بررسی آرایش آن ساختار مولکولی آن را شبیه‌سازی
می‌کرد. کارکرد این سیستم آنقدر خوب بود که با یک متخصص رقابت می‌کرد.
مای‌سین: در سال 1970 به منظور تشخیص عفونت‌های خونی توسعه پیدا کرد. با بررسی اطلاعات به دست آمده از شرایط بیمار و نیز نتیجه‌های آزمایش او عفونت خونی بیمار را تشخیص می‌دهد در صورتیکه اطلاعات کامل نباشد سوال‌های بیشتری می‌پرسد.
سیستم خبره با برنامه‌های کاربردی قدیمی فرق دارد( جدول 1-2). توانایی در مواجه با چالش‌های مسائل دنیای واقعی در طول فرایند برنامه که بازتاب قضاوت و بینش انسان است.
سیستم‌های خبره نباید با برنامه‌های مدل‌سازی شناختی اشتباه شود که تلاش دارد معماری مغز انسان را با جزئیات شبیه‌سازی کند. در واقع سیستم‌های خبره برنامه‌های عملی(کاربردی) هستند که برای استراتژی‌های غیرقطعی توسعه‌یافته برای حل کلاسی از مسائل خاص استفاده می‌شود.
جدول 1-2 تفاوت سیستم‌های خبره با سیستم‌های متعارف
سیستم‌های متعارف
سیستم‌های خبره
حل مسأله نیازمند ترتیبی قابل پیش‌بینی و تکراری از فعالیت‌ها است.
حل مسأله نیازمند پویایی، برنامه‌های گرداننده متن، واقعیت، ارتباطات و قوانین است.
برای تعیین دقت و کامل بودن از معیارهای ساده استفاده می‌کند.
کارایی سیستم بر اساس درجه دقت و کمال اندازه گرفته می‌شود که برای برقراری صحت توضیح مورد نیاز است.
2-7-1 مفاهیم سیستم‌های خبره
بعضی از مفاهیم سیستم‌های خبره و سیستم‌های متعارف در جدول 2-2 آمده است.
یک سیستم خبره به صورت نرمال 2 جنبه دارد :
محیط توسعه که توسط سازمان برای تغییر سیستم مورد استفاده قرار می‌گیرد.

[do_widget id=kl-erq-2]

برای مثال اگر طول الگوی متن را L قرار دهید پس الگوی متن شامل اصطلاح انتخاب شده و شامل L اصطلاح از متن سمت چپش و L اصطلاح از متن سمت راستش است. درجه مجموعه فیلتر کلمه عمومی و اصطلاحات ریشه از این الگو به صورت نرمال کوچک‌تر از 2است زیرا بعضی از کلمه‌های عمومی و بسیاری اصطلاحات 2 بار می‌آیند و بعضی از اصطلاحات ریشه یکسان دارند.
در این مقاله، ما از طول ثابت، برای الگو استفاده نمی‌کنیم اما طول متغیر الگوهای متنی بر اساس وفق دهی پویا با متنش را استفاده می‌کنیم. در آن به وسیله استفاده از شمای توزین اصطلاحات بر اساس تفاوت بین کلمه‌های عمومی و کلمات غیر عمومی بیان کرد که اهمیت کلمات عمومی به اندازه کلمه‌های غیر عمومی بالا نیست. اگر نویسنده ایده را بسیار خلاصه به وسیله پیوستن کلمه‌های اصلی به هم فرموله کند پس به صورت نرمال از بسیاری از کلمه‌های عمومی استفاده نمی‌کند و طول الگوی متن می‌تواند کوچک باشد. اگر نویسنده متن را با سبک گل و بلبل فرموله کند به این معنی که نوشته‌اش را با روش واضح و ساده بیان نکند پس به صورت نرمال از کلمه‌های عمومی زیادی استفاده می‌کند و الگوی متنی باید بزرگ‌تر باشد. در کاوش داده مقدار طول الگوی متن L و u درصد اهمیت کلمهها‌ی عمومی و v درصد اهمیت کلمه‌های غیر عمومی است. در زیر نحوه ارزیابی این روش بیان می‌شود.
برای تشخیص ایده‌های جدید و مفید، اندازه گیری خاص کاوش ایده را به کار می‌بریم. به وسیله مقایسه بردار از متن جدید با کلماتی که از شرح مسأله بدست آمده است، ما می‌توانیم مقدار نتیجه را همیشه بین %5 تا %100 با استفاده از این اندازه گیری محاسبه کنیم. بزرگ‌ترین مقدار نتیجه احتمال این است که بردار از متن جدید ایده مفید و جدید در رابطه با بردار از شرح مسأله را ارائه می‌دهد.
ما از این اندازه گیری برای مقایسه بردارها از متن جدید با بردارهای مشابهشان در شرح مسأله استفاده می‌کنیم اما نه با همه‌ی بردارها، این به این دلیل است که مقایسه بردار با بردار بسیار مشابه‌اش مقادیر نتیجه با قطعیت بهتری را از مقایسه بردار با بردارهای بیشتری را می‌دهد. برای مثال، اگر بردار از متن جدید با بردار از شرح مسأله مشابه باشد، پس ایده جدید نیست بدون در نظر گرفتن اینکه آیا مقادیر نتیجه از مقایسه این بردار با بردارهای بیشتری از شرح مسأله بزرگ‌تر از صفر هستند یا نه؟
بنابراین، ما می‌توانیم مطمئن باشیم که برداری ایده جدید و مفید را ارائه می‌دهد که مقدار نتیجه بزرگ را از کاوش ایده در رابطه با مشابه‌ترین بردارش را بدهد. با توجه به اینکه، محاسبه اندازه گیری کاوش ایده زمان بر است. بنابراین، این ضروری است که تعداد مقایسه‌ها با روش کاوش ایده برای پیاده سازی برنامه کاربردی کاوش ایده را محدود کنیم.
در اینجا روش دسته بندی 2 مرحله‌ای را انتخاب می‌کنیم. در مرحله اول هر بردار از متن جدید با تمام بردارها از شرح مسأله را به وسیله استفاده از اندازه گیری فاصله اقلیدسی مقایسه می‌کنیم. خوشبختانه محاسبه اندازه گیری فاصله اقلیدسی زمان بر نیست بنابراین برای پیاده سازی برنامه کاربردی کاوش ایده مناسب است. با معیار فاصله اقلیدسی برای هر بردار از متن جدید، تمام بردارهای مشابه آن از شرح متن را شناسایی کرده که مقدار نتیجه فاصله اقلیدسی آن کم‌ترین است، بدین معنی که مشابه‌ترین بردارها را شناسایی می‌کنیم. در مرحله دوم، هر بردار را از متن جدید با مشابه‌ترین بردارهایش با استفاده از روش کاوش ایده مقایسه می‌کنیم.
هر بردار از متن جدید- که با چندین بردار مشابه‌اش مقایسه شده- بالاترین مقدار نتیجه را از روش کاوش ایده به عنوان مقدار نتیجه می‌گیرد. برای شناسایی ایده جدید و مفید از متد برش آلفا استفاده می‌کنیم. برش آلفا مقدار نتیجه روش کاوش ایده مجموعه‌ای از تمام بردارها از متن جدید است که مقدار نتیجه مربوطه‌اش بزرگ‌تر یا مساوی آلفا (ᾱ) است[7].
2-5-1 نتایج استفاده از روش کاوش ایده
در یک بررسی برای وزارت دفاع آلمان، مقاله[7] از رویکرد کاوش ایده برای تشخیص ایده‌های تکنولوژی جدید برای برنامه تحقیقاتی وزارت دفاع آلمان استفاده کرد. به طور کلی، آنها باید ایده ها و راهحل جدید را جهت حل مسائل جاری در وزارت دفاع آلمان بر اساس پروژه‌های تحقیقاتی تشخیص می‌دادند.
آنها ایدههای جدید را از توضیحات 300 پروژه تحقیقاتی اعطا شده در سال 2006 به وسیله کمیته تکنولوژی و استاندارد بین‌الملل (NEST) در ایالات متحده تحت عنوان برنامه تحقیق مشاغل کوچک نوآوری، استخراج کردند. آنها از اطلاعات متنی از وزارت دفاع فعلی و از پروژه‌های تحقیقاتی وزارت دفاع آلمان به عنوان شرح مسأله استفاده کردند. به عنوان نتیجه آنها چندین ایده جدید را استخراج کردند که برای طراحان تحقیقات وزارت دفاع آلمان مفید بودند و اکنون به عنوان نقطه شروع برای پروژه‌های مشارکتی یا برای پروژه‌های تحقیقاتی جدید تحت وزارت دفاع استفاده می‌شود.
راه حل مناسب این ایده‌ها یک موضوع استراتژیک است و تأثیرات اساسی در کارایی سیستم‌های دفاعی آینده دارد. در اینجا بعضی مثال‌های موفقیت آمیز را بیان می‌کنیم. تکنولوژی آرایه تغییر فاصله کانونی هواپیما شناسایی شد که می‌تواند برای ایجاد آشکار سازی طیف فرابنفش دور استفاده شد. این به بهبود شناسایی نظامی منجر شد.
این ایده جدید است تاکنون تکنولوژی آرایه‌ای فاصله کانونی هواپیماها در نزدیکی منطقه ماوراء بنفش
و مادون قرمز و بصری استفاده می‌شد.
علاوه بر این رویکرد تشخیص تجهیزات جانمایی التراسونیک پرسنل که به صورت اورجینال به منظور فراهم ساختن جهت گیری ممکن برای جنگجویان آتش در دود متراکم توسعه پیدا کرده بود. اغلب می‌تواند برای بهبود جایگیری و ناوبری سربازان در جنگ‌های شهری استفاده ‌شود.
علاوه بر این، رویکردی که نشان می‌دهد استفاده از تکنولوژی فتودیود بهمنی می‌تواند بهره برداری داخلی و جریان تاریکی ردیاب مادون قرمز را بهبود بخشد.که می تواند برای بهبود شناسایی نظامی بکار رود.
مقاله[7] نشان داد که بعضی از ایده‌های استخراج شده به صورت اتوماتیک برای طراحان تحقیقات تکنولوژی از وزارت دفاع آلمان مفید است. متأسفانه، شرح مسأله به کاربرده شده (اطلاعات متنی درباره وزارت دفاع فعلی بر اساس پروژه‌های تحقیقاتی) به صورت محدوده شده برای آلمان دسته بندی شد به این معنی که اجازه نمی‌دهد این نتایج در کمیته‌های علمی توزیع گردد.
بنابراین آنها از نتایج این مطالعه برای ارزیابی رویکرد کاوش ایده استفاده نکردند. اگر چه یک ارزیابی جداگانه با استفاده از داده‌های انحصاری برای محاسبه ارزیابی دوباره انجام شد.
2-5-2 ارزیابی روش کاوش ایده
نتایج [7] از معیارهای فراخوانی رایج در بازاریابی اطلاعات بر اساس مثبت درست، مثبت غلط و منفی غلط استفاده کردند. بر اساس این، آن‌ها باید اصل راستی را برای ارزیابیشان تعریف می‌کردند. بنابراین متخصص خبره اغلب ایده‌های جدید و مفید را از این تعریف به صورت دستی تشخیص می‌داد به این معنی است که بدون استفاده از رویکرد کاوش ایده بود. آن‌ها از تعریف ایده در بخش 2-3 استفاده کردند. بنابراین هر الگوی متنی بر اساس پیدا کردن اصطلاحات ارائه شده در وسیله شناخته شده (یا هدف) را چک می‌کردند و اصطلاحاتی که هدف ناشناخته (یا وسیله) را ارائه می‌دادند شناسایی می‌کردند. این نتایج اصل درستی برای ارزیابی بود. [7] مقادیر بازگشتی و دقت را با استفاده از معیار کاوش ایده و با استفاده از ضریب جکارد محاسبه کردند. در نهایت مقادیر میانگین بازگشتی و دقت را حساب می‌کردند. به عنوان نتیجه مقدار دقت %40 و مقدار فراخوانی %25 را با استفاده از رویکرد کاوش ایده با معیار کاوش ایده را بدست آوردند.
مقدار دقت 40% به این معنی است که اگر رویکرد کاوش ایده 10 الگوی متنی را استخراج کرده پس چهار تای آن‌ها ایده جدید و مفید را ارائه می‌دهند.
مقدار فراخوانی %25 به این معنی است که اگر چهار ایده‌ی جدید و مفید در متن جدید وجود داشته باشد پس رویکرد کاوش ایده تنها یکی از آن‌ها را استخراج کرده است. بر اساس این، مقدار دقت %30 و مقدار فراخوانی %20 را به وسیله‌ی ضریب جکارد بدست آورده شد.
این به این دلیل است که در بعضی از متن‌ها ضریب جکارد الگوهای متنی را از متن جدید استخراج می‌کند که شبیه الگوهای متنی از شرح مسأله است این شاید ایده‌ی شناخته شده را ارائه دهد اما ایده جدید نیست. در کنار ضریب جکارد اغلب معیارهای ابتکاری شناخته شده دیگر را نظیر کوسین و شاخص همپوشانی به عنوان شاخص پایه تست کردیم. که نتایج مشابه مقدار دقت (%30) و مقدار فراخوانی (%20) را بدست آوردند.
2-6 کاربردهای روش کاوش ایده
اگرچه روش کاوش ایده روش جدیدی است اما بعد از اینکه مطرح شد در زمینه تجاری به کار برده شد، در زیر به دو مورد از کاربرد آن در این زمینه پرداخته می‌شود.
2-6-1 استفاده از کاوش ایده در نوآوری سرویس در زنجیره ارزش کسب و کار
در سال 2011 از این روش در یافتن سرویس‌های جدید برای سازمان استفاده شد. بالا رفتن اطلاعات و تکنولوژی‌های ارتباطی پشتیبانی و نیاز به مشتری مداری و زمان کمتر برای بازاریابی را به همراه داشت. انقلاب وب 2 قدرت بیشتری را برای مشتری به ارمغان آورد که منجر شد تا شرکت‌ها آگاهی‌شان را نسبت به نیازهای مشتری بالا ببرند. شرکت‌ها بیشتر از این نمی‌توانند تنها به توانایی‌های داخلی سازمان برای پی بردن به نیازهای خارجی وابسته باشند. لذا، شرکت‌ها باید در مدی پویا با هر شخص- شرکاء، رقبا، آموزش‌دهندگان، دولت و بیشتر از همه مشتریان- تعامل داشته باشند. شبکه‌های ارزش تجاری فرصت‌های جدیدی برای مشارکت‌های نوآورگرا فراهم آورد. شرکت‌ها ممکن است دانش خودشان را خارجی کنند در حالیکه دانش خارج را وارد می‌کنند، ایده‌ها ممکن است خارج شوند در حالیکه شرکت‌ها ایده‌های ایجاد شده توسط دیگر شرکت‌ها را وارد می‌کنند. ایده‌هایی در مورد سرویس‌های جدید که به نظر می‌رسد برای شرکت غیر مرتبط باشد می‌تواند برای دیگری با ارزش باشد. فاکتور کلیدی موفقیت شبکه کسب و کار داشتن سیستم یا پلت فرمی است که شرکت‌کنندگان برای اشتراک دانش و سرویس‌ها برای سود و فایده تمام شرکت‌کنندگان را با هم جمع کند. چارچوب پیشنهادی [9] (شکل2-2) توسعه سرویس‌های جدید را از طریق یکپارچه‌سازی مشتریان، تأمین‌کنندگان و رقبا را در فرایند نوآوری پشتیبانی می‌کند.

1-7 مراحل انجام تحقیق
مطالعات اولیه و ادبیات مسأله [do_widget id=kl-erq-2]
شناخت مسأله و پیاده سازی آن
ارزیابی آن با استفاده از مقالات موجود
مطالعه کاربرد روش در زمینه‌های مختلف
بیان کاربرد جدید برای این روش
1-8 مروری اجمالی به چندی از تحقیقات و مطالعات انجام گرفته
روش کاوش ایده اولین بار در سال 2008 توسط Dirk Thorleuchter, Dirk Van den Poel در یک پروژه تحقیقی برای وزارت دفاع آلمان معرفی شد که از تکنیک‌های کاوش متن برای بدست آوردن ایده‌های جدید استفاده کردند [8].آن‌ها در سال 2009 رویکرد کاوش ایده را با درجه دقت بیشتری ارائه دادند. برای این رویکرد بر اساس فرضیات موجود برنامه کاربردی طراحی شده و روی اینترنت قرار داده شده است. در این سایت که چندین زبان را پشتیبانی می‌کند می‌توان کاربرد این روش را مشاهده کرد بدین منظور تنها لازم است که کاربر متنی که مسأله را بیان کرده و متنی که احتمال وجود راه‌حل برای مسأله مورد نظر در آن است را وارد کند تا در نهایت جواب را دریافت کند که به صورت متنی است که ایده‌های جدید پیدا شده در متن را به صورت جمله به کاربر نشان می‌دهد [7]. بعد از اینکه این روش مطرح شد استفاده‌های مختلف از آن در زمینه‌های گوناگون مطرح شد. در مقاله [9] از روش کاوش ایده به منظور ایجاد سرویس‌های جدید برای بهبود کسب و کار با استفاده از اطلاعات موجود در اینترنت و مقاله‌های تحقیقی استفاده می‌کند. در واقع از این روش به منظور هدف‌گرا کردن جستجو در صفحات وب به جای استفاده از موتورهای جستجوی ساده استفاده می‌کنند تا بتوانند بحث‌های کاربران را در وبلاگ‌ها و پیام‌ها شناسایی و پردازش کنند و همچنین بتوانند آیتم‌های جدیدی که مورد علاقه کاربران واقع شده است را شناسایی کنند و با استفاده از این کاوش سرویس‌های جدید را به منظور رقابت با رقبا ارائه می‌دهد و همچنین مقاله‌ [10,11]است که در آن از کاوش ایده به منظور نوآوری در محصول و توسعه و تحقیق درباره محصول جدید با استفاده از کاوش متن‌های اینترنتی که بیانگر نیازهای مصرف‌کنندگان است استفاده می‌کند و علاوه بر آن از روش کاوش ایده به منظور کاوش وب برای پیدا کردن مشتریان و شرکت‌های سودآور استفاده می‌کند.
1-9 ساختار پایان‌نامه
در فصل دوم به بیان مقدمه و تاریخچه روش کاوش ایده و کاربرهای آن و سیستمهای خبره و مراحل مهندسی آن پرداخته می‌شود.
فصل سوم، به چگونگی ارزیابی روش داده‌های مورد نیاز برای آن و نحوه تجزیه و تحلیل آن می‌پردازد.
فصل چهارم، با توجه به روش کاوش ایده نحوه استفاده از آن در متون فارسی و کاربرد آن در سیستمهای خبره را بیان می‌کند.
فصل پنجم، شامل جمع‌بندی و ارائه پیشنهاداتی برای تحقیقات آینده است.
فصل دوم: ادبیات تحقیق
2-1 مقدمه
روش کاوش ایده روشی است که از تکنیک‌های کاوش متن و تکنیک جدیدی به نام کاوش ایده برای بدست آوردن ایده‌های جدید از متون غیر ساختار یافته استفاده می‌شود. این روش که در وزارت دفاع المان برای اولین بار ایجاد و به کار برده شد متنی که حاوی توضیح مسأله مطرح شده و متنی که احتمالاً ایده جدید برای حل این مسأله در آن مطرح شده است را به عنوان ورودی‌هایش دریافت می‌کند و با استفاده از تکنیک‌های که به کار می‌برد ایده‌های جدید و مفید را استخراج می‌کند و در نهایت با استفاده از روشی قابل درک برای کاربر آن را در خروجی نمایش می‌دهد.
ما در این تحقیق ابتدا در بخش 2-2 مروری اجمالی بر کاوش متن خواهیم داشت تا در مورد پایه و اساس روش کاوش ایده که کاوش متن است بحث کنیم. که در این قسمت بیشتر، کلیات کاوش متن که در کاوش ایده مورد استفاده قرار گرفته است را مورد بحث قرار می‌دهیم. در بخش بعدی تعریف ایده را بیان می‌کنیم تا با این کار از شبه‌هایی که در زمینه این واژه ممکن است وجود داشته باشد پرهیز کنیم و بتوانیم بر اساس این تعریف دامنه کار را بهتر مشخص کنیم. در بخش 2-4 به بررسی اساس و پایه ایجاد ایده می‌پردازیم تا بتوانیم نحوه به وجود آمدن این روش و در واقع ایده به وجود آمدن این روش را بهتر درک کنیم. در بخش 2-5 روش کاوش ایده را مورد بحث قرار می‌دهیم که مراحل مختلف این روش را به طور کامل شرح می‌دهد. در بخش 2-5-1 به ارزیابی روش کاوش ایده می‌پردازیم تا بتوانیم میزان دقت و صحت این روش را ببینیم.
در بخش بعدی کاربردهای کاوش ایده را بیان می‌کنیم. که در بخش 2-6-1 به کاربرد این روش در زمینه کسب و کار و برای یافتن سرویس‌های جدید اشاره خواهیم کرد. در بخش 2-6-2 کاربرد این روش در توسعه و تحقیق محصول جدید را بیان می‌کنیم. از آنجایی که ایده من در این مقاله علاوه بر پیاده‌سازی این روش به زبان فارسی به کار بردن آن در زمینه توسعه سیستمهای خبره است در بخش 2-7 مروری بر مفهوم سیستمهای خبره خواهیم داشت و در بخش 2-7-1 فرایند مهندسی دانش را مورد بررسی قرار می‌دهیم. در ادامه در قسمت 2-7-2 مراحل مهندسی دانش و در نهایت در بخش 2-7-2-1 مرحله کشف دانش را بیان خواهیم کرد.
2-2 کاوش متن
تکنیک کاوش متن به استخراج اتوماتیک اطلاعات از داده‌های متنی غیر ساختار یافته تخصیص داده می‌شود. تفاوت عمده کاوش متن با داده‌کاوی این است که داده‌کاوی استخراج اطلاعات از پایگاه داده‌های ساختار یافته است در حالیکه کاوش متن روی متن‌های غیر ساختار یافته کار می‌کند. کاوش متن برای کشف و استخراج اطلاعات از ساختار ضمنی متن‌ها به کار می‌رود و در پردازش زبان طبیعی نیز مورد استفاده قرار
می‌گیرند [12].در واقع کاوش متن بخش خاصی از داده‌کاوی است که به عنوان فرایندی که اطلاعات با کیفیت بالا را از متن‌ها بدست می‌آورد به حساب می‌آید. کاوش متن یک فرایند سه مرحله‌ای است که متن ورودی را در اولین مرحله ساختار یافته می‌کند، الگوهای جدید و مشاهده نشده را در داده‌های متنی ساختار یافته در مرحله دوم شناسایی می‌کند و در مرحله سوم، نتایج را ارزیابی و تفسیر می‌کند [12].معمولاً مرحله اول در بسیاری از موارد کاربرد کاوش متن سیر یکسانی را دنبال می‌کند اما مرحله دوم و سوم بنا بر نیاز زمینه‌های خاص با هم متفاوت است. ابزارهای کاوش متن طی این سه مرحله ساخته می‌شوند و در زمینه‌های مختلف مورد استفاده قرار می‌گیرند. در مرحله اول که همان مرحله پیش پردازش است متن اولیه پاک‌سازی می‌شود (مثلاً از عکس یا تگ‌ها و… ). نشانه‌گذاری‌ها حذف و فرهنگ لغتی برای تصحیح خطاهای نوشتاری به کار برده می‌شود. سپس شناسه‌ها جدا می‌شوند که واحد اصطلاح کلمه است و تبدیل حروف (تبدیل اصطلاحات به حروف کوچک و بزرگ کردن کاراکتر اول جمله در زبان‌های که دارای حروف بزرگ و کوچک هستند) اعمال می‌شود.
معمولاً در قسمت فیلتر کردن متن چندین روش به کار می‌رود. ادات سخن نشانه‌گذاری شده برای شناسایی گروه نحوی اصطلاحات به کار برده می‌شود. فیلتر کلمات عمومی اغلب برای شناسایی اصطلاحات با اطلاعات کم یا بدون مضمون استفاده می‌شود. با ریشه‌یابی بر اساس فرهنگ لغت ریشه کلمات (جایی که ریشه مشابه کلمات مرتبط ارائه می‌شود) شناسایی می‌شود.
مضافاً توزیع زیف برای کاهش تعداد اصطلاحات با استفاده از حذف اصطلاحات کمیاب به کار برده می‌شود. بعد از این کار اصطلاحات انتخاب شده به صورت دستی چک می‌شوند. سپس بردارهای متنی ساخته می‌شوند. در مرحله دوم از این بردارهای متنی با شیوه‌های مختلف جهت استخراج اطلاعات استفاده می‌شود تا الگوهای جدید را کشف کند. که در نهایت این الگوها برای ارزیابی میزان مفید بودنشان در مرحله سوم مورد ارزیابی قرار می‌گیرند.
ابزار کاوش متن در این فرایند سه مرحله‌ای ساخته می‌شوند تا بتوان از آن در زمینه‌های مختلف بهره جست. همان‌طور که حجم داده‌های غیر ساختار یافته در حال افزایش است، ابزار کاوش متن که آن‌ها را وارسی می‌کند به صورت فزاینده با ارزش می‌شوند. برای مثال، ابزارهایی که در زمینه‌های پزشکی به کار گرفته می‌شوند، که حجم اطلاعات در موضوع خاصی سبب شده که این کار برای یک محقق غیر ممکن باشد که تمام آن‌ها را کشف کند. روش‌های کاوش متن اغلب برای دولت و آژانس‌های امنیتی که سعی دارند هشدارهای تروریستی و دیگر تهدیدهای امنیتی را قبل از اینکه شانس رخ دادن داشته باشند را پیدا کنند، مفید است، آموزش، حیطه دیگری است که کاوش متن در آن بسیار مفید واقع شده است. دانش‌آموزان و آموزگاران بهتر قادر خواهند بود که اطلاعات مربوط به موضوع‌هایشان را نسبت به روش‌های سنتی پیدا کنند. برای محققان کاوش متن، کاربردهای تجاری می‌توانند هدف بسیار امیدبخشی باشد. ابزارهای کاوش متن می‌تواند به شرکت‌ها در آنالیز رقیبانشان، پایگاه مشتری و استراتژی‌های بازاریابی کمک کند [13]. این تنها قسمتی از کاربردهای کاوش متن است و استفاده از آن در تمام زمینه‌ها به سرعت در حال افزایش است. اهمیت فزاینده کاوش متن در مقابل رشد چشمگیر حجم اطلاعات بیشتر نمایان می‌شود و محققان در همه زمینه‌ها به اهمیت استفاده از این روش برای رقابت و پیشی گرفتن در بازارهای جهانی واقف هستند.
2-3 ایده چیست
ما در اینجا ایده را از دیدگاه تکنولوژیکی تعریف می‌کنیم. در این دیدگاه تعریف ایده ترکیبی از دو چیز است: معنی و هدف وابسته. مثالی برای ایده ترانزیستور است. ترانزیستور وسیله‌ای نیمه رسانا است که می‌تواند به منظور تقویت یا سوئیچ سیگنال‌های الکترونیکی به کار برده می‌شود. در اینجا ما معنی (وسیله نیمه رسانا) و هدف وابسته (تقویت یا سوئیچ سیگنال‌های الکترونیکی) را داریم. به طور کلی در اینجا بحث از یک ایده جدید است به این معنی که اگر معنی شناخته شده مربوط به هدفی ناشناخته باشد یا اگر هدف شناخته شده مربوط به معنی ناشناخته باشد. بنابراین ایده جدید می‌تواند نانو مگنت باشد زیرا نانو مگنت آهنربای کوچک شده‌ای است که می‌تواند برای تقویت یا سوئیچ سیگنال به کار رود. در این مثال معنی ناشناخته نانو مگنت و هدف شناخته شده تقویت سیگنال را دایم. این ایده جدید می‌تواند مفید باشد زیرا در آینده نانو مگنت می‌تواند جایگزین ترانزیستور شود [7]. بنابراین ایده تکنولوژیکی تنها معنی جدید را ارائه نمی‌دهد بلکه اغلب هدف جدید و معنی ترکیبی را بیان می‌کند. به وسیله شناسایی سیستماتیک هدف‌ها، معنی‌ها و ترکیب هدف و معنی در متن‌های تکنولوژیکی غیر ساختار یافته، جستجوگر اتوماتیکی ایده می‌تواند به کار برده شود. در واقع همین ایده‌های جدید اساس پروژه‌های تحقیقی جدید هستند. این به این معنی است که برای طرح‌ریزی برنامه پروژه‌های تحقیقی لازم است که ایده‌های تکنولوژیکی جدید از جامعه علمی به عنوان اساس پروژه‌های تحقیقی آینده شناسایی شود [8].

عنوان صفحه
شکل 2-1: فرایند رویکرد کاوش ایده……………………………………………………………………………21 [do_widget id=kl-erq-2]
شکل 2-2: چارچوب نوآوری- معماری سیستم…………………………………………………………….31
شکل 3-2 : ساختار سیستم خبره………………………………………………………………………………….35
شکل 4-2 : فرایند مهندسی دانش…………………………………………………………………………………39
شکل 1-4: استفاده از روش کاوش ایده در فرایند مهندسی دانش……………………………………..56
فصل اول: مقدمه و کلیات تحقیق
1- 1 مقدمه:
حجم اطلاعات در سال‌های اخیر با رشد چشمگیری در حال افزایش است و از طرفی سازمان‌ها و شرکت‌ها نیز هر روزه با مسائل و مشکلات جدید روبه‌رو می‌شوند که شاید راه‌حل بسیاری از این مسائل در این توده عظیم اطلاعات باشد که در جای جای دنیا در بستری به نام اینترنت پراکنده شده و یا به صورت اسناد، مقالات، گزارشات و… در بایگانی شرکت‌ها و سازمان‌ها قرار دارد. بسیاری از سازمان‌ها با استفاده از افراد خبره در زمینه‌های مختلف سعی بر آن داشته که بتوانند راه‌حل‌هایی برای این مسائل پیدا کنند که مطمئناً زمان‌بر و پر هزینه خواهد بود. روش کاوش ایده راه‌حلی برای این موضوع است تا با پیدا کردن راه‌حل برای مسایل موجود به صورت مکانیزه در زمان و هزینه به صورت کارا صرفه‌جویی کنیم. کاوش متن یا کشف دانش از متن‌ها به صورت کلی به فرایند استخراج اطلاعات و دانش مفید از متن‌های غیر ساختار یافته ارجاع داده می‌شود. با ارجاع به این کاوش ایده، فرایند اتوماتیکی برای استخراج ایده‌های مفید و جدید از متن غیر ساختار یافته با استفاده از متدهای کاوش متن است و هدف این روش اگرچه پیدا کردن ایده‌های جدید و مفید است اما اغلب ارائه دادن این ایده‌ها به صورت قابل درک برای کاربر است [7,8]. این روش در وزارت دفاع آلمان برای اولین بار به کار گرفته شد و با استفاده از افراد خبره مورد ارزیابی قرار گرفت. نتایج حاصل از این تحقیق نشان داد که این روش کارایی لازم را دارد اگرچه به دلیل حساس بودن نتایج برای وزارت دفاع المان این نتایج مخفی ماند اما در نهایت این روش برای مسایل مختلف در این وزارت مورد استفاده قرار گرفت و راه‌حل‌های مفیدی را برای مسائل مختلف آن پیدا کرد.
1-2 تعریف مسأله و سوالات اصلی تحقیق
در راستای پیاده سازی و استفاده از روش کاوش ایده سوالات زیر را می‌توان مطرح کرد:
دلیل استفاده از این روش به جای روش‌های دیگر از جمله ضریب جکارد چیست؟
چه روش‌های دیگری غیر از این روش وجود دارند؟
این روش در چه زمینه‌هایی کاربرد دارد؟
آیا پیاده‌سازی این روش به زبان فارسی قابل ارزیابی است؟
ایده‌های بدست آمده از این روش به چه میزان مفید و جدید هستند؟
آیا میتوان در زمینههای دیگر از این روش استفاده کرد؟
1-3 فرضیه‌ها
در این مسأله فرض بر این است که یک مسأله وجود دارد و متن‌های زیادی در قالب مقالات، اسناد، گزارشات و … وجود دارند که احتمالاً راهحل این مسأله در آن‌ها وجود دارد، هدف پیدا کردن راه‌حل این مسأله از این متن‌ها به وسیله یک رویکرد خودکار است که سبب می‌شود استخراج ایده‌ها و راه‌حل‌ها بسیار سریع‌تر و ارزان‌تر انجام شود.
1-4 موضوع و اهداف پژوهش
هدف از این پایان‌نامه ایجاد برنامه کاربردی روش کاوش ایده به زبان فارسی است تا بتوان از منابع و مقالات موجود به زبان فارسی ایده‌های جدید و مفید را برای حل مسأئل موجود پیدا کرد. همچنین استفاده از این روش در پیادهسازی سیستمهای خبره است در واقع از این روش برای گرداوری دانش در فرایند مهندسی دانش استفاده شود تا این روش را هر چه بیشتر کاربردی شود.
1-5 روش تحقیق
روش انجام این تحقیق مطالعه و گرداوری اطلاعات لازم در زمینه روش کاوش ایده است که نتایج را می‌توان با نمونه انگلیسی آن ارزیابی کرد و همچنین مطالعه در زمینه سیستمهای خبره است که این روش می‌تواند به بهبود مراحل مهندسی آن کمک کند.
1-6 جنبه‌های نوآوری
با پیاده‌سازی این روش به زبان فارسی یکی از روش‌های جدید در زمینه متن‌کاوی برای متون فارسی وجود خواهد داشت و با به کار بردن آن در سیستمهای خبره راه جدیدی برای گردآوری دانش و غنی سازی پایگاه دانش به وجود خواهد آمد.

ضرایب جکارد و اطمینان
همانطور که در بخش 2-2 بیان شد، مقدار دقت %30 و مقدار فراخوانی %20 به وسیله‌ی ضریب جکارد بدست آورده شد در حالیکه برای روش کاوش ایده مقدار دقت %40 و مقدار فراخوانی %25 بدست آورده شد. [do_widget id=kl-erq-2]
از معایب این روش می توان گفت که تمام ایده های جدید را پیدا نمی کند لذا ممکن است دانش جدیدی در متن باشد که این روش آن را ارائه ندهد اما این عیب برای سایر روش ها نیز وجود دارد و هیچ کدام از روشها هنوز کامل نیستند. و عیب دیگر آن این است که بیشتر برای سیستم های تشخیص قابل استفاده است.
فصل پنجم : نتیجه گیری
1-5 نتیجه گیری
در این مقاله روش کاوش ایده بیان شد که آن را با استفاده از زبان C#.NET برای زبان فارسی پیاده‌سازی کردیم تا بتوان از مزایای این روش که کم هزینه بودن و سرعت آن در یافتن ایده‌های جدید برای حل مسائل مختلف است بهره جست. همانطور که میدانیم مقالهها، گزارشات و… مختلفی در قالب متن به زبان فارسی وجود دارد که هر کدام از آنها میتواند منبعی از ایدهها برای مسائل مختلف باشد. بنابراین استفاده از این روش در زبان فارسی میتواند مفید واقع شود خصوصا که کاربردهای مختلفی از این روش در حال گسترش است. همانطور که در فصل های قبل بیان کردیم استفاده از این روش در زمینه کسب و کار در حال افزایش است که برای مزایای رقابتی سازمانها بسیار مفید واقع شده است. این روش نسبت به روش‌های موجود مانند ضریب جکارد کارایی بالاتری دارد لذا جایگزین مناسبی برای آن در حوزه‌های مختلف خواهد بود. بعد از مطرح شدن این روش و پیاده‌سازی آن در زبان‌های مختلف کاربردی کردن این روش در زمینه‌های مختلف مطرح گردید. بیشترین کاربرد این روش تا کنون در زمینه کسب و کار بوده از جمله در پیدا کردن سرویس‌های جدید یا جایگزین برای شرکت‌ها و سازمان‌ها که در آن از این روش برای یافتن ایدههای جدید برای رسیدن به سرویس های جدید بودو همچنین پیدا کردن نیازهای مشتریان بر اساس اطلاعاتی که مشتریان در وبلاگهای خود قرار دادهاند بوده است. در این مقاله کاربرد جدیدی برای این روش در پیاده سازی سیستم‌های خبره بیان شد. در واقع از روش کاوش ایده برای کشف دانش در فرایند مهندسی دانش استفاده شد تا با به کار بردن آن بتوان از لابلای گزارشات و اسناد مختلف و به احتمال زیاد با حجم بالا دانش مفید را استخراج کنیم و سبب شود مرحله کشف دانش از فرایند مهندسی دانش از نظر زمان و هزینه بهبود پیدا کند. علاوه بر استفاده از این روش در مرحله کشف دانش میتواند از آن در فاز نگه‌داری سیستم نیز استفاده کرد تا ضامن خوبی برای به روز بودن سیستم باشد بدون اینکه نیاز باشد که کاربری مدام مشغول پیدا کردن دانش جدید باشد.
5-1 پیشنهادها و یافته‌های تحقیق
از آن جایی که این روش روشی جدید است از جهات مختلفی می‌تواند برای تحقیقات آینده استفاده شود که در زیر مواردی از آن بیان میشود:
مسیری برای تحقیقات بیشتر به وسیله این واقعیات که امروزه تعداد زیادی از اطلاعات متنی روی اینترنت در دسترس است و این اطلاعات احتمالاً شامل ایده‌های بسیار زیاد تکنولوژیکی جدید است داده شده است. توسعه این رویکرد به رویکرد کاوش ایده تحت وب که به صورت اتوماتیک ایده‌های حل مسأله را از اینترنت شناسایی می‌کند یک موضوع جالب برای تحقیقات بیشتر است. که تحولی در نحوه جستجو کردن در اینترنت میتواند باشد به این معنی که میتوانیم بجای اینکه عبارت خاصی را جستجو کنیم و جواب های مختلفی پیدا شود، شرح مختصری از مسأله را به عنوان ورودی به موتور جستجو داده و راه حل آن را به عنوان خروجی یا نتیجه دریافت کنیم.
به علاوه، پارامترهای رویکرد می‌توانند بهینه شوند و معیار کاوش ایده می‌تواند با استفاده از خبرههای بیشتر توسعه پیدا کند، به منظور بهبود کیفیتش که به این معنی است که نتایج بهتری برای مقادیر فراخوانی و دقت بدست آید.
جنبه‌های بیشتر تبدیل این رویکرد کاوش داده به زبان محاوره‌ای است. برای این لازم است که تعریف ایده شامل ایده‌ی محصولات جدید از مشتریان باشد که در واقع نمونه آن را میتوان در به کار بردن این روش در کاوش وبلاگهای مشتریان مشاهده کرد. پس ایده محصول جدید می‌تواند برای فعالیت‌های پشتیبانی بازار شناسایی شود. در واقع میتوان از این روش را هرچه بیشتر در بحث کسب و کار کاربردی کرد.
در آخر، رویکرد می‌تواند با جنبه‌های مبتکرانه توسعه پیدا کند. پس ایده‌های استخراج شده می‌تواند به عنوان ایده‌های نوآوری دسته بندی شود و ممکن است به عنوان نقطه شروعی برای توسعه محصولات جدید به کار رود. در واقع خود ایدههای یافته شده بوسیله این روش راهی نوین برای تحقیقات در زمینههای مختلف را فراهم میکند.
منابع
عباس دولانی، سید داود حسینی نسب، بهروز نیک نفس، “روش های تحقیق مورد استفاده در پایان نامه های فارغ التحصیلان دانشگاه علوم پزشکی تبریز “، فصلنامه علمی پژوهشی پژوهشگاه علوم و فناوری اطلاعات ایران، شماره 2، 1388، ص 169-187.
مسعود موحدی، محمد امیر نیکجو، “نگاهی به روش شناسی و تحقیقات پیرامون سیستم های اطلاعاتی”، مجموعه مقالات اولین  همایش بین المللی روش تحقیق در علوم، فنون و مهندسی10-9 خرداد،1385 .
محمد حسین دیانی، “روش تحقیق در: دائره المعارف کتابداری و اطلاع رسانی”، به کوشش عباس حری، تهران کتابخانه ملی جمهوری اسلامی ایران، 1381.
زهره سرمد، عباس بازرگان، الهه حجازی، “روشهای تحقیق در علوم رفتاری”، انتشا
رات آگه تهران، 1382.
[do_widget id=kl-erq-2]

(experts)
Sources of Knowledge
(Documents, forms, …)
Idea mining
Idea evaluation
Knowledge
Representation
Inferencing
Knowledge
Base
Explanation,
justification
Knowledge acquisition
Encoding
شکل1-4: استفاده از روش کاوش ایده در فرایند مهندسی دانش
روش کاوش ایده در فاز نگه‌داری فرایند مهندس دانش نیز می‌تواند مفید باشد. البته همان‌طور که در اول این بخش نیز گفته شد این روش بیشتر برای سیستم‌های پرسش و پاسخ مفید است زیرا پیدا کردن ایده‌های مفید سبب بهبود هر چه بیشتر سیستم می‌شود. از آنجاییکه دانش با رشد قابل چشمگیری در حال افزایش است نیاز به به‌روز نگهداری پایگاه دانش امری ضروری است تا سیستم‌های خبره با کیفیت بالاتری کار کنند. لذا می‌توان از روش کاوش ایده برای جستجو در اسناد جدید و یا سایت‌های مرتبط با مساله که در صورت وجود ایده‌جدید که منجر به کشف دانش جدید می‌شود استفاده کرد. که این دانش می‌تواند به پایگاه دانش اضافه و یا جایگزین دانش قبلی شود. با اینکار بدون نیاز به فرد خبره پایگاه دانش سیستم خبره به روز خواهد بود و کیفیت سیستم همیشه در حد مناسبی خواهد بود.
4-4 مزایا و معایب استفاده از روش کاوش ایده در فرایند مهندسی دانش
در روشهایی که از کلاسبندی و خوشه بندی به تنهایی استفاده کرده اند تنها دامنه مطالعه برای کشف دانش را کمتر کرده اند اما روش کاوش ایده ایده جدید که همان دانش جدید است را در قالب یک جمله ارائه می دهد که از نظر زمانی بسیار مناسب تر از روشهای کلاسبندی و خوشه بندی است.در برخی تحقیقات از روش کلاسبندی و ضریب اطمینان استفاده کرده اند که همانطور که بخش 2-5-2 بیان کردیم روش کاوش ایده نتایج بهتری نسبت به این ضرایب می دهد. بنابراین حتی اگر به همراه خوشه بندی یا کلاسبندی هم استفاده شوند باز روش کاوش ایده مناسب تر خواهد بود. جدول 4-1 نتایج مقایسه روش کاوش ایده را با روشهای دیگر بیان می کند.
جدول 4-1 مقایسه روش کاوش ایده با دیگر روشها در مکانیزه کردن کشف دانش
روشهای دیگر
روش کاوش ایده
کلاسبندی
روش کلاسبندی نیاز به داده اولیه برای کلاس بندی دارد و ممکن است کلاس های غیر ضروری زیادی بدست آورد و بیشتر برای داده های ترتیبی مانند اطلاعات مشتریان بانک مناسب است.اما روش کاوش ایده روی هر متنی کار کرده و ایده های مرتبط با شرح مساله را پیدا میکند پس زمان کمتری را صرف می کند و نتایج بهتری را می دهد
خوشه بندی
در خوشه بندی تنها می توان خوشه مرتبط با مساله را جدا کرد و شاید در این
خوشه هیچ دانش جدیدی وجود نداشته باشد در واقع دامنه محدود می شود. اما روش کاوش ایده تنها به دنبال پیدا کردن ایده جدید یا دانش جدید است نه فقط متون مرتبط به مساله.
[do_widget id=kl-erq-2]

سپس، تعیین شد که مقدار برش آلفا α معیار اندازه گیری کاوش ایده m باشد. اگر درصد α کوچک باشد پس اصطلاحات نتیجه‌ی بسیاری بدست می‌آید. این منجر می‌شود که مقدار دقت کوچک باشد زیرا بسیاری از الگوهای متنی استخراج شده شامل ایده جدید و مفید نیستند اگر α بزرگ باشد پس تنها تعداد کمی از نتایج را خواهیم داشت و احتمالاً مقدار برگشتی ما کوچک خواهد بود زیرا ما بسیار از ایده‌های مفید و جدید را در متن جدید پیدا نکردیم. اشخاص خبره نتایج چندین متن را برای مقدار بهینه چک کردند. آن‌ها به این تجربه دست یافتند که 60% یک سازش خوب است بنابراین، α را 60% قرار دادند[7].
4-3 استفاده از روش کاوش ایده در فرایند مهندسی دانش
همان طور که در بخش شرح دادیم یکی از مشکل‌ترین مراحل فرایند مهندسی دانش، کشف دانش است. در این مرحله که به گرداوری دانش پرداخته می‌شود چون منابع گرداوری زیاد هستند به عنوان مرحله‌ای زمان‌بر و پرهزینه قلمداد می‌شود لذا سعی بر آن بوده که بتوانند این مرحله هر چه بیشتر مکانیزه کنند. همان‌طور که در آن بخش شرح دادیم از جمله این منابع سندها، گزارشات، فرم‌ها و… هستند که مهندس دانش باید از لابه‌لای آن‌ها دانش مورد نظر را پیدا کرده و مستندسازی کند. از طرفی باید از خبره‌ها نیز کمک بگیرد. استفاده از روش کاوش ایده در پیدا کردن دانش از لابه‌لای متون می‌تواند مفید باشد خصوصاً برای سیستم‌های خبره‌ای که به صورت پرسش و پاسخ بوده و سعی در حل کردن مسائل مربوطه را دارند. مثلاً سیستم رفع عیب ماشین را در نظر بگیرید که قرار است توسط مهندس دانش طراحی شود. علاوه بر خبره‌ها در این زمینه مستندات زیادی در قالب متن نیز وجود دارند. خبره می‌تواند یک شرح اولیه از مشکلات ماشین تهیه کند و به عنوان شرح مسأله به برنامه کاوش ایده بدهید و از طرف دیگر مستندات موجود را به عنوان متن جدید ارائه دهد همان‌طور که می‌دانیم روش کاوش ایده با سرعت زیاد به کاوش متون پرداخته و ایده‌های جدید را از لابه لای آن پیدا می‌کند و حتی می‌توان برای غنی سازی پایگاه دانش از سایت‌های مرتبط با مسأله استفاده کرد و این به این دلیل است که دیگر مهندس دانش دستی این کار را انجام نمی‌دهد بلکه از روشی مکانیزه استفاده می‌کند بنابراین می‌توان منابع را تا هر میزان که لازم است زیاد کرد. همان‌طور که در بخش شرح داده شد این روش نتایج بهتری از ضریب جکارد می‌دهد بنابراین روش مفیدتری نبست به آن خواهد بود. بنابراین می‌توان فرایند مهندسی دانش را به صورت شکل تغییر داد.
در شکل 1-4 از روش کاوش ایده برای کاوش در مستندات استفاده می‌کنیم و مهندس دانش از خبره‌ها برای جمع آوری دانش کمک می‌گیرد . ایده‌ها ابتدا ارزیابی می‌شوند و بعد به صورت دانش ارائه می‌شوند تا در پایگاه دانش ذخیره شوند. ارزیابی ایده‌ها باید توسط مهندس دانش صورت گیرد.
Knowledge
Validation
(test cases)
Sources of Knowledge
(experts)
Sources of Knowledge
(Documents, forms, …)
Idea mining
Idea evaluation
Knowledge
Representation
Inferencing
Knowledge
Base
Explanation,
justification
Knowledge acquisition
Encoding
Knowledge
Validation
(test cases)
Sources of Knowledge

تعریف 2: L ثابت برای الگوی متنی است Li left تعداد اصطلاح‌ها از متن چپ الگوی متنی است که در اطراف اصطلاح Wi ساخته شده است. Li right تعداد اصطلاحات از متن راست الگوی متنی است که در اطراف اصطلاح Wi ساخته شده است. پس ما
Li left N و Li right N را به صورت زیر تعریف می‌کنیم. [do_widget id=kl-erq-2]
بعد از محاسبه Li left و Liright از متن جدید، بردار اصطلاح را در مدل فضای برداری ایجاد می‌کنیم. اندازه‌ی بردار به وسیله تعداد اصطلاحات متفاوت فیلتر شده کلمات عمومی در ریشه‌ها در متن جدید بدست می‌آید. برای رمز گذاری الگوی متنی، از بردارهای متنی باینری استفاده می‌کنیم که به این معنی است که عضوهای بردار برابر 1 هستند اگر اصطلاح غیر ریشه‌ای مشابه در الگوی متن استفاده شود و 0 اگر اصطلاح نباشد. که اغلب الگوی متنی را از شرح مسأله می‌سازیم و بردار را از طریقی که در بالا بیان شد ایجاد می‌کنیم.
با روش کاوش ایده، ما برداری که الگوی متن را ارائه می‌دهد از متن جدید با مشابه‌ترین بردارهایش از شرح مسأله را به منظور تشخیص اینکه جدید و مفید است مقایسه می‌کنیم. ابتدا باید الگوی متنی را از متن جدید پیدا کنیم که تمام اصطلاحات معنی (هدف) را ارائه دهند و هیچ اصطلاحی در هدف (معنی) که در الگوی متن از شرح مسأله ارائه می‌شود نداشته باشد. اگر تمام الگوهای متن از متن جدید شناخته شده باشند. به این معنی که تمام اصطلاحات در الگوی متنی از شرح مسأله رخ داده باشد. پس ایده برای کاربر جدید نیست بنابراین ایده مفید نیست اگر تمام اصطلاحات در الگوی متن از متن جدید ناشناخته باشند زیرا هیچ ارتباطی به مسأله ندارد؛ و این در m2 نشان داده شده است که برای یافتن ایده جدید و مفید، تعداد اصطلاحات شناخته شده و تعداد اصطلاحات ناشناخته باید متوازن باشند.
تعریف 3: مجموعه از اصطلاحات فیلتر شده‌ی کلمات عمومی و ریشهای ارائه شده در الگوی متنی با شماره i از متن جدید است. مجموعه از اصطلاحات فیلتر شده کلمات عمومی و ریشه ای ارائه شده در الگوی متنی با شماره j از شرح مسأله است. مجموعه ای اصطلاحات فیلتر شده کلمات عمومی و ریشه ای از متن جدید است. X= || درجه است.
{1 , 1 بردار اصطلاح از مدل فضای برداری در رابطه با است.
{0,1 بردار اصطلاح از مدل فضای برداری در رابطه با است.
P=|| = تعداد تمام اصطلاحات در الگوی متنی با شماره i است.
q=| تعداد اصطلاحات شناخته شده در الگوی متن با شماره i در رابطه با الگوی متن با شمارۀ متن با شمارۀ j در شرح مسأله است.
پس 1m را به عنوان اندازه گیری توزیع متوازن اصطلاحات شناخته شده و ناشناخته به صورت زیر تعریف می‌کنیم.
اصطلاحات شناخته شده در الگوی متن از متن جدید باید در شرح مسأله بسیار متناوب‌تر از بقیه اصطلاحات رخ داده باشند. این به این دلیل است که آن‌ها معنی شناخته شده یا هدف شناخته شده را ارائه می‌دهند که بخش اصلی از مسأله است. در شرح مسأله اصطلاحاتی که مسأله را ارائه می‌دهند بسیار متناوب‌تر از بقیه تکرار می‌شوند. برای همین، ما این اصطلاحات متناوب را به وسیله استفاده از درصد Z به عنوان پارامتر تعریف می‌کنیم و m2 را به عنوان تعداد اصطلاحات شناخته شده و متناوب در کنار تعداد کل اصطلاحات بدست می‌آوریم.
تعریف 4:
Z درصد است. مجموعه از %Z اصطلاحات فیل‌تر شده‌ی کلمات عمومی و ریشه‌ای بسیار متناوب در شرح مسأله است. بردار متنی در مدل فضای برداری در رابطه با است. r= | تعداد اصطلاحات شناخته شده است که به طور متناوب در شرح مسأله رخ می دهند. m2 را به عنوان معیار اندازه گیری برای رخ دادن متفاوت اصطلاحات شناخته شده در شرح مسأله تعریف می‌کنیم.
اصطلاحات ناشناخته در الگوی متن از متن جدید رویکرد جدید ارائه می‌دهند، که بخش اصلی از ایده جدید است. این اصطلاحات به صورت نرمال بسیار متناوب‌تر از بقیه اصطلاحات در متن جدید رخ می‌دهند زیرا این متن با ایده جدید سروکار دارد. برای همین، ما اغلب این اصطلاحات متناوب را به وسیله استفاده از درصد Z به عنوان پارامتر تعریف می‌کنیم و. را به عنوان تعداد اصطلاحات متناوب ناشناخته در طول تعداد کل اصطلاحات ناشناخته محاسبه می‌کنیم.
تعریف 5: 𝛗 مجموعه‌ای از %Z از اصطلاحات فیل‌تر شده کلمات عمومی و ریشه‌ای بسیار متناوب در متن جدید است. τ بردار متنی در مدل فضای بردار در رابطه با 𝛗 است.
S=|
تعداد اصطلاحات ناشناخته است که به طور متناوب در متن جدید رخ می‌دهد، ما m3 را به عنوان معیار اندازه گیری برای رخداد متناوب اصطلاحات ناشناخته در متن جدید تعریف می‌کنیم.
بعضی کلمه‌ها (مانند بیشترین، مهم‌ترین، ماکزیمم، مینیمم و …)در یک عبارت اغلب بیانگر رخ دادن ایده جدید در آن عبارت هستند. آن‌ها به هدف متغیر یا معنی متغیر اشاره می‌کند و می‌توانند شاخصی برای ایده جدید باشد.
تعریف :6 مجموعهای از این اصطلاحات خاص است. [0,1 𝝷 بردار اصطلاح در مدل فضای اصطلاح در رابطه با است.= F=| تعداد این اصطلاحات خاص در الگوی متنی با شماره i است. ما m4 را به عنوان معیار اندازه گیری برای هدف و معنا متغییر در نظر می گیریم.
m4=
معیار اندازه گیری کاوش داده بستگی به تمام چهار زیر معیار اندازه گیری اکتشافی است.
تعریف 7: h={1, … , 4} و فاکتور وزنی با معیار اندازه گیری کاوش ایده مجموع تمام این چهار زیر معیار ضرب شده در فاکتور های وزنی gh در حالتی است که pq:
M=
نتایج در زیر معیارهای سوم و دوم بستگی به پارامترها دارد. این پارامترها تفاوت تناوب اصطلا
حات در مسأله است مجموعه %Z از بیشترین تناوب اصطلاحات فیل‌تر شده استفاده می‌شوند.
در روش کاوش ایده به صورت ابتکاری تعیین شد که این پارامتر باید بین %10 با %30 باشد تا زیر معیارهای خوبی بدست آورد. این به این دلیل است که اگر Z بیشتر از 30% باشد پس ما شاید چندین اصلاح را دسته بندی کنیم که تنها یک‌بار به عنوان اصطلاح متناوب رخ داده‌اند؛ و اگر Z کمتر از %10 باشد ما تنها اصطلاحات بسیار متناوب را برای مجموعه شناسایی می‌کنیم. بنابراین، Z را مقدار میانگین قرار دادند (%20).
به علاوه، مشاهده کردیم که زیر معیارهای 3 و 2 به یک اندازه موفق هستند و زیر معیار چهارم کمتر موفق است بنابراین به صورت ابتکاری پارامتر. را %50 و %20= و %20= و %10= قرار دادند.
[do_widget id=kl-erq-2]

علاوه بر اینکه از خبره‌های متعددی کمک گرفته می‌شود از منابع متعدد نیز استفاده می‌کنند از جمله کتاب، مقالات، گزارشات و …
برای سرعت بخشیدن به فرایند کشف دانش از نرم‌افزارهای کامپیوتری برای کشف دانش از اسناد داده‌ای استفاده می‌کنند. دلایل استفاده از کشف دانش خودکار را می‌توان به صورت زیر بیان کرد:
برای افزایش سودمندی مهندسی دانش (کاهش هزینه)
برای کاهش سطح مهارت مورد نیاز برای مهندس دانش
برای حذف نیاز به خبره (یا کاهش زیاد آن)
برای حذف نیاز به مهندس دانش (یا کاهش آن)
برای افزایش کیفیت دانش اکتسابی
برای سیستم‌های خبره مبتنی بر قانون، از متدی قدیمی با استفاده از متد استنتاجی در یادگیری ماشین استفاده می‌شود. دانش ممکن است از اسناد کشف شود که این در واقع همان کاوش متن است که می‌تواند در کشف دانش از متن‌های غیر ساختار یافته مفید باشد. کشف از منبع مستندسازی شده پتانسیل قوی برای اتوماسیون است. دانش مستندسازی شده در هر نوع می‌تواند به سادگی و ارزانی اسکن شود و به پایگاه داده کامپیوتری تبدیل شود. دانش می‌تواند سپس با استفاده از تکنولوژی‌های هوش مصنوعی تحلیل شود. در واقع سیستم خبره می‌تواند برای ساخت سیستم خبره دیگری مورد استفاده قرار گیرد. توانایی ساخت سیستم خبره که بتواند پایگاه داده‌ها، کتاب‌های الکترونیکی، ژورنال‌ها و مجله‌ها را اسکن کند در حال افزایش است. داده‌های ذخیره شده در کامپیوتر دیگر می‌تواند به صورت الکترونیکی بازیابی شده و برای ایجاد و به‌روزرسانی پایگاه دانش سیستم خبره بدون نیاز به فرد خبره یا مهندس دانش مورد استفاده قرار گیرد. متدهایی برای تفسیر معانی به منظور تشخیص قوانین توسعه پیدا کرده‌اند[19]. هدف این تحقیق ارائه روشی با استفاده از رویکرد کاوش ایده برای این مرحله از مهندسی فرایند دانش است.
فصل سوم : روش تحقیق
3-1 مقدمه
پایه و اساس تولید علم، تحقیق است. از طرفی تحقیق بستر اصلی برای درک عمیق و دقیق از حقایق، تفکر و اندیشه می‌باشد. در این میان انتخاب روش صحیح و متناسب با اهداف پژوهش و به کار بردن ابزار همسو با آن، در اثر بخشی و صحت نتایج هر پژوهش دارای اهمیت است[1]. چنانچه روش متناسبی با موضوع پژوهش انتخاب شود، کار تحقیق سریع‌تر و مطمئن‌تر انجام می‌شود.
روش تحقیق همانند ابزارهای متفاوت در جعبه ابزار است که محقق متناسب با تحقیق خود باید آن را به کار ببرد [2]. روش تحقیق در واقع راه رسیدن به مطلوب یا کشف واقعیت آن گونه که هست را نشان می‌دهد. و نیز روش تحقیق به کلیه تدابیر، ابزار و فنون برای کشف حقیقت گفته می‌شود [3] . به عبارت دیگر،روش تحقیق چارچوب عملیات یا اقدامات جستجوگرانه برای تحقق هدف پژوهش،جهت آزمون فرضیه یا پاسخ دادن به سوال‌های تحقیق را فراهم می‌آورد [4].
در این فصل از تحقیق، روش پژوهش، روش گردآوری داده‌ها و روش تجزیه و تحلیل اطلاعات تشریح می‌شود.
3-2 روش تحقیق
معمولاً روش‌های تحقیق از منظرهای مختلفی دسته بندی می‌شوند. در اینجا دو نوع دسته‌بندی بر اساس هدف تحقیق و بر اساس نحوه گرداوری داده بیان می‌شود.
3-2-1 بر اساس هدف تحقیق
بر اساس هدف تحقیق روش‌های تحقیق به سه دسته تقسیم می‌شوند:
1- تحقیق بنیادی: هدف اساسی این نوع تحقیقات آزمون نظریه‌ها ، تبیین روابط بین پدیده‌ها و افزودن به مجموعه دانش موجود در یک زمینه خاص است . تحقیقات بنیادی ،نظریه‌ها را بررسی کرده ،آن‌ها را تایید ،تعدیل یا رد می‌کند . با تبیین روابط میان پدیده‌ها ،تحقیق بنیادی به کشف قوانین و اصول علمی می‌پردازد . با این اهداف ، تحقیقات بنیادی درصدد توسعه مجموع دانسته‌های موجود درباره اصول و قوانین علمی است. این نوع تحقیقات نتیجه گرا بوده و در رابطه با نیازهای تصمیم گیری انجام نمی‌شود برای مثال تحول استدلال منطقی نزد کودکان را می‌توان از نوع تحقیقات بنیادی دانست[4,5].
2- تحقیق و توسعه: فرایندی است که به منظور تدوین و تشخیص مناسب بودن یک فرایند ، روش‌ها و برنامه‌های، شناسایی نیاز یا استعداد، پیدایش اندیشه‌ها ،آفرینش طراحی ،تولید ، معرفی و انتشار یک محصول و فرایند یا نظام فناوری تازه، انجام می‌شود. هدف اصلی فعالیت‌های R&Dنظریه پردازی یا آزمون نظریه نیست بلکه توسعه محصولات یا فرایندهای جدید، تدوین یا تهیه برنامه‌ها ، طرح‌ها و امثال آن است. به طوری که ابتدا موقعیت نامعین خاصی مشخص شده و بر اساس یافته‌های پژوهشی ، طرح یا برنامه ویژه آن تدوین و تولید می‌شود[4,5].
3-تحقیق کاربردی: هدف تحقیقات کاربردی توسعه دانش کاربردی در یک زمینه خاص است .به عبارت دیگر تحقیقات کاربردی به سمت کاربرد عملی دانش هدایت می‌شود . نتایج این نوع تحقیقات در تعلیم و تربیت مثلاً در طراحی برنامه‌های درسی و کمک به اتخاذ تصمیم‌های مربوط به نظام آموزشی به کار می‌رود . به عنوان مثال کاربرد نظریه‌های مربوط به فرا شناخت در حل مسأله را می‌توان در زمره تحقیقات کاربردی قرار داد[4]. روش این مقاله کاربردی است.
3-2-2 بر اساس نحوه گردآوری داده‌ها(تحقیق توصیفی):
تحقیق توصیفی شامل مجموعه روش‌هایی است که هدف آن‌ها توصیف کردن شرایط یا پدیده‌های مورد بررسی است. اجرای تحقیق توصیفی می‌تواند صرفاً برای شناخت شرایط موجود یا یاری دادن به فرایند تصمیم گیری باشد [4].
بیشتر تحقیقات علوم رفتاری را می‌توان در زمره تحقیق توصیفی به شمار آورد[4]
که بر اساس این تقسیم‌بندی پن
ج نوع تحقیق را می‌توان نام برد :
تحقیق پیمایشی
تحقیق همبستگی