تحصیل در کشور کانادا یکی از اهداف دانش جویان و دانش آموزان در سرتاسر دنیا است که سالانه آمار قابل توجهی از افراد را روانه این کشور کرده است.شاید شما جزو آن دسته از افرادی باشید که در هدف تحصیلی خود تحصیل در این کشور را داشته باشید.

تحصیل در کانادا

چرا تحصیل در کانادا ؟ شاید بد نباشید بدانید که چرا انتخاب بیشتر افراد در دنیا برای تحصیل کشور کانادا می باشد

  1. کیفیت آموزشی سطح بالا
  2. مدرک با اعتبار بالا در سرتاسر دنیا
  3. در لیست ده کشور برتر دنیا از نظر سازمان کلل متحد برای تحصیل
  4. رده هفتم کشوری مهربان و صلح جو در دنیا می باشد
  5. در گروه جی هفت جزو 5 کشور برتر از نظر اقتصادی در دنیا می باشد
  6. شهر مونترال کانادا به عنوان ششمین شهر هوشمند دنیا می باشد.
  7. از نظر کیفیت زندگی در سایت News & World Report، رتبه اول را بدست آورده است.
  8. در رتبه هفتمین کشور شاد دنیا می باشد
  9. 95 درصد از فارغ اتحصیلان دانشگاه های این کشور مشغول به کار هستند
  10. دومین کشور دنیا از لحاظ داشتن سیستم آموزشی
  11. شانس اخذ اقامت دائم بعد از تحصیل

در ادامه هفده دانشگاه ممتاز کانادا برای گرفتن پذیرش برای تحصیل در کانادا را بیان می کنیم:

  1. Dalhousie دانشگاه
  2. Laval دانشگاه
  3. Montréal School Higher Commercial Studies (HEC Montréal)
  4. دانشگاه مک گیل MCGILL دانشگاه
  5. McMaster دانشگاه
  6. Queen’s دانشگاه
  7. دانشگاه سایمون فریزر(Simon Fraser)
  8. Université de Montreal
  9. Université de Montreal Ecole Polytechnique
  10. دانشگاه Alberta
  11. دانشگاه British Columbia
  12. دانشگاه Calgary
  13. دانشگاه Guelph صرفاً در رشته های کشاورزی و دامپروری
  14. دانشگاه Ottawa
  15. دانشگاه Toronto
  16. دانشگاه Victoria
  17. دانشگاه Waterloo

بعضی از کالج های کانادا کالج داوسون کالج سنکا هزینه تحصیل در کانادا ۲۰۱۹ کانادا با اینکه یکی از کشورهای خوب و ویژگی هایی عالی برای آموزش و تحصیل دارد اما هزینه آن به مراتبط معقول تر از تحصیل در کشور های آمریکا و انگلیس می باشد. یکی از نکات جالب در کشور کانادا این است که دانشگاه ها بیشترین تاثیر در میزان هزینه تحصیل را دارد. سه معیار تاثیر گذار دانشگاه ها برای میزان شهریه :

  1. برنامه تحصیلی که دانشگاه ها ارائه می دهند
  2. دانشجوی بومی یا دانشگاه های غیر بومی
  3. مقطع تحصیلی شما

یکی از نکات مهمی که برای سال 2018 -2019 برای شهریه دانشجویان باید در نظر گرفت هزینه تحصیلی دانشجویان بومی 3/3 و هزینه دانشجویان غیر بومی 6/6 درصد افزایش پیدا کرده است. مقاله های مرتبط با تحصیل در کانادا: انواع بورسیه های کانادا بورسیه تحصیل در کانادا مهاجرت به کانادا از طریق تحصیل بهترین دانشگاه های کانادا در سال ۲۰۱۸ تحصیل در کانادا رابین افتخار گروه رابین رضایت متقاضیان و نتایج درخشان دانشجویان در تمامی مقاطع برای تحصیل در خارج از کشور بوده است. اکثر متقاضیان ما توسط دانشجویان پیشین مان معرفی شده اند چرا که احترام ، پاسخگویی ، سرعت و دقت در کار خط مشی اعضای گروه موسسه بین المللی رابین برای تحقق شعار ” موفقیت دانشجو هدف ماست” می باشد . بخشهای متفاوت گروه رابین(لاوند شامل : بخش مشاوران ، بخش پذیرش تحصیلی و ویزا ، بخش بازاریابی ، بخش مالی و ارز، بخش اداری و بخش IT با ارائه کار تخصصی در کوتاه ترین زمان و با کمترین هزینه شما را در رسیدن به هدفتان برای ادامه تحصیل در کشورهای مقصد یاری می کنند .

ادامه تحصیل در کشور استرالیا

تحصیل در کشور استرالیا این روزها یکی از اهداف دانشجویان و داشن آموزان کشور عزیزمان ایران می باشد.اگر شما هم جزو آن دسته از افراد هستید که می خواهید کشور استرالیا را برای ادامه تحصیل انتخاب کنید خواندن این مقاله را از دست ندهید. در ادامه دلایلی را که این کشور برای تحصیل و زندگی انتخاب می شود را برای شما بیان می کنیم.شاید جالب باشد که بدانید پنج شهر کشور استرالیا در 30 شهر برتر دنیا برای ادامه تحصیل از نظر هزینه زندگی , استخدام کار دانشجویی, و کیفیت زندگی مناسب قرار دارد. تحصیل در استرالیا امتیاز قابل توجهی که دانشگاه های استرالیا در بین همه دانشگاه های دنیا کسب کرده 92.6 می باشد که رده چهارم در جهان است.یکی از نکات جالب و قابل توجه برای دانشگاه های استرالیا این است که این دانشگاه های در رزومه خود 15 جایزه نوبل, صد ها جایزه علمی و اختراعات مهمی چون جعبه سیاه هواپیما , اینترنت نوع وایرلس , … می باشد.ویژگی های مهم برای دانشجویان بین المللی یکی از ویژگی های مهم برای دانشجویان خارجی مقیم در استرالیا این است که آنها می تواند بعد از فارغ التحصیلی از دانشگاه های خود برای دریافت اقامت دائم و شغل مناسب در این کشور اقدام کنند.یکی از آمار های مهم در این زمینه رضایت 86 درصدی دانشجویان مقیم این کشور برای تحصیل می باشد. کشور استرالیا رتبه سوم در بین کشورهایی که بیشترین دانشجویان بین المللی را پدیرا می باشند را دارا می باشد. آمارهای مهم که کشور استرالیا به خود اختصاص داده است.

  1. شهر آدلاید استرالیا به عنوان پنجمین شهر مناسب برای زندگی در بین 140 کشور دنیا
  2. رتبه نهم مهربانترین و صلح جوترین کشور دنیا
  3. در بین 100 دانشکاه های برتر دنیا 7 دانشگاه استرالیا قرار دارند
  4. رتبه 5 در 35 کشور عضوOECD (همکاری و توسعه اقتصادی) در زمینه داشتن توانایی دانش آموختگان دانشگاه ها

هزینه های زندگی در استرالیا شما که به عنوان دانشجو یا دانش آموز می خواهید به این کشور برای تحصیل بروید اگر کسی را داشته باشید که قبلا در استرالیا تحصیل کرده باشد می توانید از تجربیات تحصیل در استرالیا استفاده کنید. اما اگر نه بهتر است بدانید چه هزینه هایی را باید تقبل کنید:

  1. مقطع تحصیلی که میخواهید در آن به تحصیل بپردازید

مقاطع تحصیلی که در استرالیا می توانید برای تحصیل در آن اقدام کنید از پیش دانشگاهیی شروه و به دکتری ختم می شود.مسلما مقاطع تحصیلی بالاتر دارای هزینه بالاتر ی هستند.

  1. رشته مورد نظر شما برای تحصیل

یکی از مواردی که در هزینه تحصیل شما بسیار تاثیر گذار است رشته ای است که شما برای تحصیل انتخاب می کنید .

  1. دانشگاه محل تحصیل

یکی از موارد مهم این است که دانشگاه شما در کدام شهر است .یعضی از شهر های استرالیا کلا هزینه زندگی چه دانشجو باشید چه نباشید گران است.شهرهای کم جعیت چون سیدنی ,آدلاید ارزانتر از شهرهایی مثل پرت می باشند. دانشگاه های برتر استرالیا:

  1. Australian National University
  2. Monash University
  3. The University of New South Wales
  4. The University of Queensland
  5. The University of Sydney
  6. The University of Western Australia
  7. University of Adelaide
  8. University of Melbourne
  9. Macquarie University

تحصیل در استرالیا با موسسه رابین افتخار گروه رابین رضایت متقاضیان و نتایج درخشان دانشجویان در تمامی مقاطع برای تحصیل در خارج از کشور بوده است. اکثر متقاضیان ما توسط دانشجویان پیشین مان معرفی شده اند چرا که احترام ، پاسخگویی ، سرعت و دقت در کار خط مشی اعضای گروه موسسه بین المللی رابین برای تحقق شعار ” موفقیت دانشجو هدف ماست” می باشد . بخشهای متفاوت گروه رابین(لاوند شامل : بخش مشاوران ، بخش پذیرش تحصیلی و ویزا ، بخش بازاریابی ، بخش مالی و ارز، بخش اداری و بخش IT با ارائه کار تخصصی در کوتاه ترین زمان و با کمترین هزینه شما را در رسیدن به هدفتان برای ادامه تحصیل در کشورهای مقصد یاری می کنند .

ادامه تحصیل در کشور لهستان

کشور لهستان به عنوان یک کشور حوزه شنگن واقع در مرکز اروپاست‌.در این کشور دانشگاه های انگلیسی زبان متعددی با سطوح کیفی و قیمت های بسیار مناسبی قرار دارند که میتوانند گزینه مهمی برای دانشجویان علاقه مند به تحصیل در خارج از کشور و دریافت اقامت یک کشور اروپایی باشند.کشور لهستان با وجود سطح بالای زندگی و دانشگاه، از نظر هزینه نسبت به سایر کشورهای اروپایی از جمله آلمان ،هلند ، دانمارک و اتریش ، بسیار مناسب تر میباشد.برای آشنایی بیشتر با این کشورو ثبت درخواست مشاوره برای بررسی امکان تحصیل در لهستان می توانید  وبسایت PolandStudy.net  و صفحات ما را در فضای مجازی دنبال کنید.

برای مشاوره با موسسه رابین کافی است فرم مشاوره تحصیلی جامع را در سایت rabin-education.com کامل کنید تا مشاوران ما با شما تماس بگیرند.

روشهای دیگر [do_widget id=kl-erq-2]
روش کاوش ایده
کلاسبندی
روش کلاسبندی نیاز به داده اولیه برای کلاس بندی دارد و ممکن است کلاس های غیر ضروری زیادی بدست آورد و بیشتر برای داده های ترتیبی مانند اطلاعات مشتریان بانک مناسب است.اما روش کاوش ایده روی هر متنی کار کرده و ایده های مرتبط با شرح مساله را پیدا میکند پس زمان کمتری را صرف می کند و نتایج بهتری را می دهد
خوشه بندی
در خوشه بندی تنها می توان خوشه مرتبط با مساله را جدا کرد و شاید در این
خوشه هیچ دانش جدیدی وجود نداشته باشد در واقع دامنه محدود می شود. اما روش کاوش ایده تنها به دنبال پیدا کردن ایده جدید یا دانش جدید است نه فقط متون مرتبط به مساله.
ضرایب جکارد و اطمینان
همانطور که در بخش 2-2 بیان شد، مقدار دقت %30 و مقدار فراخوانی %20 به وسیله‌ی ضریب جکارد بدست آورده شد در حالیکه برای روش کاوش ایده مقدار دقت %40 و مقدار فراخوانی %25 بدست آورده شد.
از معایب این روش می توان گفت که تمام ایده های جدید را پیدا نمی کند لذا ممکن است دانش جدیدی در متن باشد که این روش آن را ارائه ندهد اما این عیب برای سایر روش ها نیز وجود دارد و هیچ کدام از روشها هنوز کامل نیستند. و عیب دیگر آن این است که بیشتر برای سیستم های تشخیص قابل استفاده است.
فصل پنجم : نتیجه گیری
1-5 نتیجه گیری
در این مقاله روش کاوش ایده بیان شد که آن را با استفاده از زبان C#.NET برای زبان فارسی پیاده‌سازی کردیم تا بتوان از مزایای این روش که کم هزینه بودن و سرعت آن در یافتن ایده‌های جدید برای حل مسائل مختلف است بهره جست. همانطور که میدانیم مقالهها، گزارشات و… مختلفی در قالب متن به زبان فارسی وجود دارد که هر کدام از آنها میتواند منبعی از ایدهها برای مسائل مختلف باشد. بنابراین استفاده از این روش در زبان فارسی میتواند مفید واقع شود خصوصا که کاربردهای مختلفی از این روش در حال گسترش است. همانطور که در فصل های قبل بیان کردیم استفاده از این روش در زمینه کسب و کار در حال افزایش است که برای مزایای رقابتی سازمانها بسیار مفید واقع شده است. این روش نسبت به روش‌های موجود مانند ضریب جکارد کارایی بالاتری دارد لذا جایگزین مناسبی برای آن در حوزه‌های مختلف خواهد بود. بعد از مطرح شدن این روش و پیاده‌سازی آن در زبان‌های مختلف کاربردی کردن این روش در زمینه‌های مختلف مطرح گردید. بیشترین کاربرد این روش تا کنون در زمینه کسب و کار بوده از جمله در پیدا کردن سرویس‌های جدید یا جایگزین برای شرکت‌ها و سازمان‌ها که در آن از این روش برای یافتن ایدههای جدید برای رسیدن به سرویس های جدید بودو همچنین پیدا کردن نیازهای مشتریان بر اساس اطلاعاتی که مشتریان در وبلاگهای خود قرار دادهاند بوده است. در این مقاله کاربرد جدیدی برای این روش در پیاده سازی سیستم‌های خبره بیان شد. در واقع از روش کاوش ایده برای کشف دانش در فرایند مهندسی دانش استفاده شد تا با به کار بردن آن بتوان از لابلای گزارشات و اسناد مختلف و به احتمال زیاد با حجم بالا دانش مفید را استخراج کنیم و سبب شود مرحله کشف دانش از فرایند مهندسی دانش از نظر زمان و هزینه بهبود پیدا کند. علاوه بر استفاده از این روش در مرحله کشف دانش میتواند از آن در فاز نگه‌داری سیستم نیز استفاده کرد تا ضامن خوبی برای به روز بودن سیستم باشد بدون اینکه نیاز باشد که کاربری مدام مشغول پیدا کردن دانش جدید باشد.
5-1 پیشنهادها و یافته‌های تحقیق
از آن جایی که این روش روشی جدید است از جهات مختلفی می‌تواند برای تحقیقات آینده استفاده شود که در زیر مواردی از آن بیان میشود:
مسیری برای تحقیقات بیشتر به وسیله این واقعیات که امروزه تعداد زیادی از اطلاعات متنی روی اینترنت در دسترس است و این اطلاعات احتمالاً شامل ایده‌های بسیار زیاد تکنولوژیکی جدید است داده شده است. توسعه این رویکرد به رویکرد کاوش ایده تحت وب که به صورت اتوماتیک ایده‌های حل مسأله را از اینترنت شناسایی می‌کند یک موضوع جالب برای تحقیقات بیشتر است. که تحولی در نحوه جستجو کردن در اینترنت میتواند باشد به این معنی که میتوانیم بجای اینکه عبارت خاصی را جستجو کنیم و جواب های مختلفی پیدا شود، شرح مختصری از مسأله را به عنوان ورودی به موتور جستجو داده و راه حل آن را به عنوان خروجی یا نتیجه دریافت کنیم.
به علاوه، پارامترهای رویکرد می‌توانند بهینه شوند و معیار کاوش ایده می‌تواند با استفاده از خبرههای بیشتر توسعه پیدا کند، به منظور بهبود کیفیتش که به این معنی است که نتایج بهتری برای مقادیر فراخوانی و دقت بدست آید.
جنبه‌های بیشتر تبدیل این رویکرد کاوش داده به زبان محاوره‌ای است. برای این لازم است که تعریف ایده شامل ایده‌ی محصولات جدید از مشتریان باشد که در واقع نمونه آن را میتوان در به کار بردن این روش در کاوش وبلاگهای مشتریان مشاهده کرد. پس ایده محصول جدید می‌تواند برای فعالیت‌های پشتیبانی بازار شناسایی شود. در واقع میتوان از این روش را هرچه بیشتر در بحث کسب و کار کاربردی کرد.
در آخر، رویکرد می‌تواند با جنبه‌های مبتکرانه توسعه پیدا کند. پس ایده‌های استخراج شده می‌تواند به عنوان ایده‌های نوآوری دسته بندی شود و ممکن است به عنوان نقطه شروعی برای توسعه محصولات جدید به کار رود. در واقع خود ایدههای یافته شده بوسیله این روش راهی نوین برای تحقیقات در زمینههای مختلف را فراهم میکند.
منابع
عباس دولانی، سی
د داود حسینی نسب، بهروز نیک نفس، “روش های تحقیق مورد استفاده در پایان نامه های فارغ التحصیلان دانشگاه علوم پزشکی تبریز “، فصلنامه علمی پژوهشی پژوهشگاه علوم و فناوری اطلاعات ایران، شماره 2، 1388، ص 169-187.

4-2 روش کاوش ایده به زبان فارسی [do_widget id=kl-erq-2]
در این بخش مراحل روش کاوش ایده و نحوه انجام مراحل مختلف آن روی متن‌های فارسی شرح داده می‌شود.
در روش کاوش ایده، از طول ثابت، برای الگو استفاده نمی‌شود بلکه از طول متغیر الگوهای متنی بر اساس وفق دهی پویا با متنش استفاده می‌شود.
در این روش از شمای توزین اصطلاحات بر اساس تفاوت بین کلمه‌های عمومی و کلمه‌های غیر عمومی و با توجه به اینکه اهمیت کلمات عمومی به اندازه اهمیت کلمه‌های غیر عمومی بالا نیست استفاده می‌شود. اگر نویسنده ایده را بسیار خلاصه به وسیله پیوستن کلمه‌های اصلی به هم فرموله کند پس به صورت نرمال از بسیاری از کلمه‌های عمومی استفاده نمی‌کند و طول الگوی متن می‌تواند کوچک باشد. اگر نویسنده متن را با سبک گل و بلبل فرموله کند به این معنی که نوشته‌اش را با روش واضح و ساده بیان نکند پس او به صورت نرمال از کلمه‌های عمومی زیادی استفاده می‌کند و الگوی متنی باید بزرگ‌تر باشد. در روش کاوش ایده مقدار طول الگوی متن L و u درصد اهمیت کلمه‌ی عمومی و v درصد اهمیت کلمه‌های غیر عمومی می‌تواند به وسیله کاربر اعمال شود.
برای محاسبه تغییر طول الگوی متن باید اول شمای توزین اصطلاح را تعریف کنیم.
تعریف 1: I=[wI …, wn] یک لیست از اصطلاحات (کلمات) wi در ترتیب ذکر شده و nتعداد اصطلاحات در T است و I ، E= [] یک مجموعه ازاصطلاحات در است. درصد U ضریب وزن اصطلاح برای کلمه عمومی است. درصد V ضریب وزن اصطلاح برای کلمه غیرعمومی است. پس ما Fg(w i) را به عنوان شمای وزن اصطلاحات تعریف می‌کنیم.
F g(w i)=
ما یک مثال برای این ارائه می‌دهیم. الگوی متن:
موبایل برای انتقال داده از مادون قرمز
در اطراف کلمه داده ساخته شده است. که این شامل خود کلمه‌ی داده و چهار کلمه از متن قبل از آن، و چهار کلمه از متن بعد از آن است.
اینجا، ما از طول ثابت 4=L استفاده کرده‌ایم و شمای وزنی اصطلاح با %100 = =. این به این معنی است که اهمیت کلمه عمومی و غیرعمومی با هم برابر است. الگوی متن بعدی مثال طول متغیر است.
“که در اولین فاز موجود در آن که از مواد و تکنولوژی‌هایی مانند سیستم‌های لایه‌ای و کریستال‌ها”
این الگوی متن در اطراف کلمه “تکنولوژی‌هایی” ساخته شده است. اینجا ما از طول ثابت L=3 استفاده کردیم و شمای وزنی اصطلاح با U=10X و V=100Y استفاده کردیم. به عنوان نتیجه این الگوی متن شامل 6 اصطلاح برای متن راست و 11 اصطلاح برای متن چپ اصطلاح “تکنولوژی‌هایی” است. در این مثال، کلمه‌های غیر عمومی، فاز، مواد، تکنولوژی، سیستم، لایه و کریستال هستند که تعداد اصطلاحات را از متن چپ و راست به صورت زیر محاسبه کردیم.
تعریف 2: L ثابت برای الگوی متنی است Li left تعداد اصطلاح‌ها از متن چپ الگوی متنی است که در اطراف اصطلاح Wi ساخته شده است. Li right تعداد اصطلاحات از متن راست الگوی متنی است که در اطراف اصطلاح Wi ساخته شده است. پس ما
Li left N و Li right N را به صورت زیر تعریف می‌کنیم.
بعد از محاسبه Li left و Liright از متن جدید، بردار اصطلاح را در مدل فضای برداری ایجاد می‌کنیم. اندازه‌ی بردار به وسیله تعداد اصطلاحات متفاوت فیلتر شده کلمات عمومی در ریشه‌ها در متن جدید بدست می‌آید. برای رمز گذاری الگوی متنی، از بردارهای متنی باینری استفاده می‌کنیم که به این معنی است که عضوهای بردار برابر 1 هستند اگر اصطلاح غیر ریشه‌ای مشابه در الگوی متن استفاده شود و 0 اگر اصطلاح نباشد. که اغلب الگوی متنی را از شرح مسأله می‌سازیم و بردار را از طریقی که در بالا بیان شد ایجاد می‌کنیم.
با روش کاوش ایده، ما برداری که الگوی متن را ارائه می‌دهد از متن جدید با مشابه‌ترین بردارهایش از شرح مسأله را به منظور تشخیص اینکه جدید و مفید است مقایسه می‌کنیم. ابتدا باید الگوی متنی را از متن جدید پیدا کنیم که تمام اصطلاحات معنی (هدف) را ارائه دهند و هیچ اصطلاحی در هدف (معنی) که در الگوی متن از شرح مسأله ارائه می‌شود نداشته باشد. اگر تمام الگوهای متن از متن جدید شناخته شده باشند. به این معنی که تمام اصطلاحات در الگوی متنی از شرح مسأله رخ داده باشد. پس ایده برای کاربر جدید نیست بنابراین ایده مفید نیست اگر تمام اصطلاحات در الگوی متن از متن جدید ناشناخته باشند زیرا هیچ ارتباطی به مسأله ندارد؛ و این در m2 نشان داده شده است که برای یافتن ایده جدید و مفید، تعداد اصطلاحات شناخته شده و تعداد اصطلاحات ناشناخته باید متوازن باشند.
تعریف 3: مجموعه از اصطلاحات فیلتر شده‌ی کلمات عمومی و ریشهای ارائه شده در الگوی متنی با شماره i از متن جدید است. مجموعه از اصطلاحات فیلتر شده کلمات عمومی و ریشه ای ارائه شده در الگوی متنی با شماره j از شرح مسأله است. مجموعه ای اصطلاحات فیلتر شده کلمات عمومی و ریشه ای از متن جدید است. X= || درجه است.
{1 , 1 بردار اصطلاح از مدل فضای برداری در رابطه با است.
{0,1 بردار اصطلاح از مدل فضای برداری در رابطه با است.
P=|| = تعداد تمام اصطلاحات در الگوی متنی با شماره i است.

[do_widget id=kl-erq-2]

2-7-4 مراحل فرایند مهندسی دانش
فرایند مهندسی دانش شامل 5 فعالیت اصلی است:
کشف دانش. کشف دانش شامل کشف دانش از افراد خبره، کتاب‌ها، اسناد، حسگرها و کامپیوترها است. دانش ممکن است در حوزه مسأله یا در روال‌های حل مسأله تشخیص داده شود، که ممکن است دانش کلی باشد (دانش درباره کسب و کار (یا ابر دانش (دانش درباره دانش) باشد. بیرد به صورت فرمال ارزیابی کرد که کشف دانش گلوگاه در توسعه سیستم‌های خبره امروزی است. بنابراین تحقیقات تئوری بیشتری دی این زمینه هنوز هم هدایت می‌شود.
ارائه دانش: دانش اکتسابی سازماندهی می‌شود بنابراین در فعالیتی به نام ارائه دانش برای استفاده آماده است. این فعالیت شامل آماده‌سازی نقشه دانش و رمزگذاری دانش در پایگاه دانش است.
ارزیابی دانش: ارزیابی دانش شامل اعتبار سنجی و ارزیابی دانش است تا زمانی که کیفیت آن قابل قبول باشد. برای تست، نتایج اغلب به حوزه خبره نشان داده می‌شود تا میزان دقت سیستم خبره ارزیابی شود.
استنتاج: این فعالیت شامل طراحی نرم‌افزار برای قادر ساختن کامپیوتر جهت ساخت استنتاج بر اساس دانش ذخیره شده و مسئله خاص است. این سیستم می‌تواند برای کاربران غیر خبره پیشنهاداتی مهیا کند.
تفسیر و توجیه: این مرحله شامل طراحی، برنامه‌نویسی توانایی تفسیر است (برنامه‌نویسی توانایی جواب دادن به سوالات به عنوان نمونه چرا یک قطعه خاص اطلاعات به وسیله کامپیوتر مورد نیاز است و یا حتی چگونه نتیجه حتمی توسط کامپیوتر اخذ می‌گردد).
شکل 4-2 فرایند مهندسی دانش و ارتباطات فعالیت‌های مهندسی دانش را نشان می‌دهد.
شکل 4-2 : فرایند مهندسی دانش
چون هدف ما کاربرد روش کاوش ایده در مرحله کشف دانش است در بخش بعدی این مرحله به صورت کامل‌تر مورد بحث قرار می‌گیرد[19].
2-7-5 مرحله کشف دانش
این مرحله وظیفه آسانی نیست. این مرحله شامل شناسایی دانش، ارائه دانش در قالبی مناسب، ساختاردهی دانش و انتقال دانش به ماشین است. فرایند کشف دانش می‌تواند به وسیله نقش‌های شرکت‌کنندگان مهم به صورت وسیع تحت تأثیر قرار گیرد: مهندس دانش، خبره، کاربر نهایی.
مهندس دانش باید به عنوان معلم ساختار دانش، طراح ابزار و سازمان دهنده و واسط بین خبره و کاربر نهایی عمل کند.
توانایی و شخصیت مهندسی دانش به طور مستقیم خبره را تحت تأثیر قرار می‌دهد. بخش موفقیت آمیز کشف دانش توسعه رابطه مثبت با خبره است. مهندس دانش باید پاسخگوی ایجاد اثر مثبت، اطلاعات ارتباطی مثبت درباره پروژه، فهمیدن سلیقه خبره‌ها، تدارک جلسات و… است. در بعضی از پروژه‌های سیستم خبره از خبره‌های متعدد استفاده می‌شود که معمولاً این کار به دلایل زیر انجام می‌شود:
درک بهتر دامنه دانش
برای بهبود ارزیابی، سازگاری، دقت، جامعیت و ارتباط دانش
برای مهیا کردن سودمندی بیشتر
برای شناسایی آسان نتایج نادرست
….
علاوه بر اینکه از خبره‌های متعددی کمک گرفته می‌شود از منابع متعدد نیز استفاده می‌کنند از جمله کتاب، مقالات، گزارشات و …
برای سرعت بخشیدن به فرایند کشف دانش از نرم‌افزارهای کامپیوتری برای کشف دانش از اسناد داده‌ای استفاده می‌کنند. دلایل استفاده از کشف دانش خودکار را می‌توان به صورت زیر بیان کرد:

برای افزایش سودمندی مهندسی دانش (کاهش هزینه) [do_widget id=kl-erq-2]
برای کاهش سطح مهارت مورد نیاز برای مهندس دانش
برای حذف نیاز به خبره (یا کاهش زیاد آن)
برای حذف نیاز به مهندس دانش (یا کاهش آن)
برای افزایش کیفیت دانش اکتسابی
برای سیستم‌های خبره مبتنی بر قانون، از متدی قدیمی با استفاده از متد استنتاجی در یادگیری ماشین استفاده می‌شود. دانش ممکن است از اسناد کشف شود که این در واقع همان کاوش متن است که می‌تواند در کشف دانش از متن‌های غیر ساختار یافته مفید باشد. کشف از منبع مستندسازی شده پتانسیل قوی برای اتوماسیون است. دانش مستندسازی شده در هر نوع می‌تواند به سادگی و ارزانی اسکن شود و به پایگاه داده کامپیوتری تبدیل شود. دانش می‌تواند سپس با استفاده از تکنولوژی‌های هوش مصنوعی تحلیل شود. در واقع سیستم خبره می‌تواند برای ساخت سیستم خبره دیگری مورد استفاده قرار گیرد. توانایی ساخت سیستم خبره که بتواند پایگاه داده‌ها، کتاب‌های الکترونیکی، ژورنال‌ها و مجله‌ها را اسکن کند در حال افزایش است. داده‌های ذخیره شده در کامپیوتر دیگر می‌تواند به صورت الکترونیکی بازیابی شده و برای ایجاد و به‌روزرسانی پایگاه دانش سیستم خبره بدون نیاز به فرد خبره یا مهندس دانش مورد استفاده قرار گیرد. متدهایی برای تفسیر معانی به منظور تشخیص قوانین توسعه پیدا کرده‌اند[19]. هدف این تحقیق ارائه روشی با استفاده از رویکرد کاوش ایده برای این مرحله از مهندسی فرایند دانش است.
فصل سوم : روش تحقیق
3-1 مقدمه
پایه و اساس تولید علم، تحقیق است. از طرفی تحقیق بستر اصلی برای درک عمیق و دقیق از حقایق، تفکر و اندیشه می‌باشد. در این میان انتخاب روش صحیح و متناسب با اهداف پژوهش و به کار بردن ابزار همسو با آن، در اثر بخشی و صحت نتایج هر پژوهش دارای اهمیت است[1]. چنانچه روش متناسبی با موضوع پژوهش انتخاب شود، کار تحقیق سریع‌تر و مطمئن‌تر انجام می‌شود.
روش تحقیق همانند ابزارهای متفاوت در جعبه ابزار است که محقق متناسب با تحقیق خود باید آن را به کار ببرد [2]. روش تحقیق در واقع راه رسیدن به مطلوب یا کشف واقعیت آن گونه که هست را نشان می‌دهد. و نیز روش تحقیق به کلیه تدابیر، ابزار و فنون برای کشف حقیقت گفته می‌شود [3] . به عبارت دیگر،روش تحقیق چارچوب عملیات یا اقدامات جستجوگرانه برای تحقق هدف پژوهش،جهت آزمون فرضیه یا پاسخ دادن به سوال‌های تحقیق را فراهم می‌آورد [4].
در این فصل از تحقیق، روش پژوهش، روش گردآوری داده‌ها و روش تجزیه و تحلیل اطلاعات تشریح می‌شود.
3-2 روش تحقیق
معمولاً روش‌های تحقیق از منظرهای مختلفی دسته بندی می‌شوند. در اینجا دو نوع دسته‌بندی بر اساس هدف تحقیق و بر اساس نحوه گرداوری داده بیان می‌شود.
3-2-1 بر اساس هدف تحقیق
بر اساس هدف تحقیق روش‌های تحقیق به سه دسته تقسیم می‌شوند:
1- تحقیق بنیادی: هدف اساسی این نوع تحقیقات آزمون نظریه‌ها ، تبیین روابط بین پدیده‌ها و افزودن به مجموعه دانش موجود در یک زمینه خاص است . تحقیقات بنیادی ،نظریه‌ها را بررسی کرده ،آن‌ها را تایید ،تعدیل یا رد می‌کند . با تبیین روابط میان پدیده‌ها ،تحقیق بنیادی به کشف قوانین و اصول علمی می‌پردازد . با این اهداف ، تحقیقات بنیادی درصدد توسعه مجموع دانسته‌های موجود درباره اصول و قوانین علمی است. این نوع تحقیقات نتیجه گرا بوده و در رابطه با نیازهای تصمیم گیری انجام نمی‌شود برای مثال تحول استدلال منطقی نزد کودکان را می‌توان از نوع تحقیقات بنیادی دانست[4,5].
2- تحقیق و توسعه: فرایندی است که به منظور تدوین و تشخیص مناسب بودن یک فرایند ، روش‌ها و برنامه‌های، شناسایی نیاز یا استعداد، پیدایش اندیشه‌ها ،آفرینش طراحی ،تولید ، معرفی و انتشار یک محصول و فرایند یا نظام فناوری تازه، انجام می‌شود. هدف اصلی فعالیت‌های R&Dنظریه پردازی یا آزمون نظریه نیست بلکه توسعه محصولات یا فرایندهای جدید، تدوین یا تهیه برنامه‌ها ، طرح‌ها و امثال آن است. به طوری که ابتدا موقعیت نامعین خاصی مشخص شده و بر اساس یافته‌های پژوهشی ، طرح یا برنامه ویژه آن تدوین و تولید می‌شود[4,5].
3-تحقیق کاربردی: هدف تحقیقات کاربردی توسعه دانش کاربردی در یک زمینه خاص است .به عبارت دیگر تحقیقات کاربردی به سمت کاربرد عملی دانش هدایت می‌شود . نتایج این نوع تحقیقات در تعلیم و تربیت مثلاً در طراحی برنامه‌های درسی و کمک به اتخاذ تصمیم‌های مربوط به نظام آموزشی به کار می‌رود . به عنوان مثال کاربرد نظریه‌های مربوط به فرا شناخت در حل مسأله را می‌توان در زمره تحقیقات کاربردی قرار داد[4]. روش این مقاله کاربردی است.
3-2-2 بر اساس نحوه گردآوری داده‌ها(تحقیق توصیفی):
تحقیق توصیفی شامل مجموعه روش‌هایی است که هدف آن‌ها توصیف کردن شرایط یا پدیده‌های مورد بررسی است. اجرای تحقیق توصیفی می‌تواند صرفاً برای شناخت شرایط موجود یا یاری دادن به فرایند تصمیم گیری باشد [4].
بیشتر تحقیقات علوم رفتاری را می‌توان در زمره تحقیق توصیفی به شمار آورد[4]

در این نوع تحقیق انتخاب و مطالعه یک مورد یا واحد یا نظام با حد و مرز مشخص به صورت کل گرایانه (holistic) صورت می‌پذیرد.
پس رویدادی ( علّی-مقایسه‌ای): [do_widget id=kl-erq-2]
هدف آن شناسایی معلول به منظور کشف علل احتمالی آن و یا مطالعه متغیر وابسته به منظور یافتن متغیر مستقل است.
3-3 متغیرهای تحقیق
در یک تحقیق برای تحقق اهداف تحقیق، تشخیص متغیرها امر ضروری است. پس از بررسی ادبیات موضوع و شناسایی معیارهای ارزیابی در تحقیقات پیشین موارد زیر به عنوان معیارهای ارزیابی فشرده سازی تصویر انتخاب شده‌اند.
مقدار دقت: به این معنی که چه تعداد از ایده‌های استخراج شده واقعاً مفید و جدید هستند.
مقدار فراخوانی : به این معنی که از ایده‌های مفید و جدید موجود در متن چه تعداد توسط روش پیدا شده‌اند.
3-4 روش‌های جمع آوری اطلاعات
در این تحقیق از مطالعات کتابخانه‌ای به طور گسترده‌ای استفاده شده است که این مطالعات شامل بررسی تحقیقات موجود و مرتبط با موضوع، مطالعه مقالات و کتب لاتین و فارسی مرتبط و همچنین استفاده از اینترنت و خصوصاً وب‌سایت کاوش ایده می‌باشد.
3-5 جامعه آماری
در صدر برنامه ریزی هر مطالعه یا تحقیقی این سوال که حجم نمونه چقدر باید باشد قرار دارد. انتخاب نمونه بزرگ‌تر از حد نیاز موجب اتلاف منابع می‌شود و انتخاب نمونه‌های خیلی کوچک منتج به نتایج غیرقابل اتکا می‌شود[6]. نمونه آماری عبارت است از تعدادی از افراد جامعه که صفات آن‌ها با صفات جامعه مشابه بوده معرف جامعه باشد. نمونه گیری نیز فرایند انتخاب نمونه است. در این تحقیق، مطالعه بر روی متن‌های مختلف که شامل توضیح مسأله و راه‌حل‌های آن می‌باشد انجام می‌گیرد .
3-5 روش‌های تجزیه و تحلیل اطلاعات
در این تحقیق، برای تجزیه و تحلیل متن‌ها، از نرم افزار C#.NET استفاده شده است. سی‌شارپ (C#) زبانی شیءگرا و سطح بالا (high level) از خانوادهٔ زبان‌های چارچوب دات‌نت شرکت مایکروسافت است.
زبان #C، یک زبان برنامه نویسی چند الگویی است و منظم شده مدل‌های تابعی، امری، عمومی، شی گرا و جز گرا می‌باشد. این زبان توسط ماکروسافت و جزئی از دات نت به وجود آمد و بعداً استانداردهای ECMAو ISO را نیز در بر گرفت. #C یکی از ۴۴ زبان برنامه نویسی ای است که توسط زمان اجرای زبان مشترک از .NET Framework پشتیبانی می‌شوند و در همه جا به وسیله مایکروسافت ویژوال استودیو شناخته می‌شود.
این زبان برپایه سادگی، مدرن بودن، همه منظوره و شی گرا بودن ساخته شد.آندرس هلسبرگ ، طراح زبان برنامه نویسی دلفی، سرپرستی تیم طراحان زبان #C را بر عهده داشت.این زبان دارای دستوری شی گرا مشابه ++C است و به شدت از زبان‌های جاوا و دلفی نیازمندمدرک تاثیر پذیرفته‌است. در ابتدا نام این زبان COOL بود که مخفف C like Object Oriented Language بود، هر چند در جولای ۲۰۰۰، زمانی که ماکروسافت پروژه را عمومی اعلام کرد، اسم آن به #C تغییر پیدا کرد.آخرین نسخه آن نسخه ۵.۰ است که همزمان با دات‌نت ۴.۵ در آگوست ۲۰۱۲ منتشر شد.
C# زبانی قوی و در عین حال انعطاف‌پذیر است و می‌تواند همانند سایر زبان‌های برنامه‌نویسی برای تولید انواع برنامه‌های کاربردی بکار رود. این زبان برای ایجاد واژه پردازها، برنامه‌های گرافیکی، صفحات گسترده و حتی کامپایلرهای زبان‌های دیگر بکار می‌رود. دلایل دیگر محبوبیت C#ویژگی‌هایی است که قبل از این ذکر کردیم: سادگی، شیء گرا بودن، ماجولار بودن و انعطاف‌پذیری،پلی مورفیسم، کپسوله‌سازی و ……
با توجه به توابع موجود در .NETامکان استفاده از این توابع وجود دارد که می توان گفت برای هر کاری شرکت ماکروسافت تابعی پیش بینی کرده است. که این امکان را ایجاد میکند که به فایل اصلی پروژه هیچ فایل کتابخانهای را اضافه نکنید(هم به صورت دستی یا خود کمپایلر) . این موضوع خود باعث ایجاد فایل های خروجی با حجم بسیار کم می شود . این موضوع در بسیاری از موارد بسیار اهمیت دارد. برنامه‌های سی شارپ، همچون تمام برنامه‌های نوشته شده در .NET و سایر محیط‌های ماشینی مجازی مانند جاوا، نیازمند منابع سیستم و حافظه بیشتری نسبت به برنامه‌های نوشته شده با سایر زبان‌ها مانند سی پلاس پلاس است و هم چنین سرعت کمتری نیز دارد. هر چند تعریف زبان #C و CLI تحت استانداردهای ISO و ECMA استاندارد شده‌اند،CLI تنها قسمتی از BCLمایکروسافت می‌باشد که شامل کلاس‌های غیر استاندارد استفاده شده در برنامه‌های #C نیز می‌شود.از این گذشته، بعضی از قسمت‌های BCL تحت حق امتیاز مایکروسافت هستند که ممکن است پیاده سازی کامل چارچوب را مختل کند، زیرا تنها بخش‌های استاندارد دارای حق محافظت RAND در برابر مدعیان را دارند.
فصل چهارم: رهیافت جدید پیشنهادی
4-1 مقدمه
در این فصل ابتدا روش کاوش ایده و نحوه عمل آن در متن‌های فارسی شرح داده می‌شود و سپس کاربرد آن را در فرایند مهندسی دانش بیان می‌کنیم.
روش کاوش ایده از معیارهای مختلفی استفاده می‌کند و برای این معیارها پارامترهای مختلفی به کار می‌برد. اکثر این پارامترها به صورت ابتکاری و با کمک خبره‌ها در زمینه‌های مختلف به دست آمده است که مقدار این پارامترها بر اساس میزان مفید بودن مقادیر مختلف در موارد مختلف بدست آمده است. در ادامه تمام معیارها و پارامترها و مقادیر انتسابی به آن‌ها بیان می‌شود.

[do_widget id=kl-erq-2]

فیلد جدول رابطه‌ای
صفات شی
اجرا قوانین ترتیبی نیست
جملات If….Then
قوانین(Rule)
با توجه به شکل 3-2 مفاهیم زیر بدین گونه در سیستم‌های خبره تعریف می‌شوند:
واسط کاربر: معمولاً در سیستم‌های خبره واسط کاربر به سه صورت است: منبع داده(فایل متنی، پایگاه داده، صفحه وب)، نظارت به یک سیستم فیزیکی(که ورودی‌ها می‌توانند از سنسورها بدست آیند) و کنترل سیستم فیزیکی(که خروجی‌ها می‌توانند سیگنالی به سیستم باشند).
پایگاه دانش: باید دانش از منابع استخراج شود و در این پایگاه قرار می‌گیرد(روش ارائه منطقی).
شکل 3-2 : ساختار سیستم خبره
مهندس دانش: سازنده سیستم خبره است که باید روش ثبت و نگه‌داری علوم و اطلاعات را در کامپیوتر مشخص کند.
مهندسی دانش: به مراحل ساخت یک سیستم خبره مهندسی دانش گفته می‌شود.
2-7-2 توسعه سیستم‌های خبره
قبل از بررسی توسعه سیستم‌های خبره نیاز داریم که مفاهیمی را بدانیم که عبارتند از:
کشف دانش: فرایند جمع‌آوری دانش برای ذخیره در پایگاه دانش است که اثبات شده مشکل‌ترین کامپوننت در فرایند مهندسی دانش است. در واقع به عنوان گلوگاه کشف دانش شناخته می‌شود و پروژه‌های سیستم‌های خبره بیشتر در این مرحله با شکست مواجه می‌شوند.
دامنه خبره: کشف دانش اغلب شامل استخراج دانش از کسانی است که در آن فیلد متخصص هستند.
استنباط دانش: فرایندی که شامل تکنیک‌های مصاحبه‌ای و غیر مصاحبه‌ای متعدد است.
پروژه سیستم‌های خبره به رویکردهای مخصوص برای مدیریت نرم‌افزار احتیاج دارد. متدلوژی‌های به کار رفته برای ساخت سیستم‌های خبره با مسأله در کشف دانش مواجه می‌شوند. در ادامه فرایند مهندسی دانش که برای طراحی سیستم‌های خبره مورد استفاده قرار می‌گیرد را شرح می‌دهیم.
2-7-3 فرایند مهندسی دانش
فرایند کشف دانش از خبره‌ها و ساختن پایگاه دانش، مهندسی دانش نامیده می‌شود. هدف مهندسی دانش شبیه مهندس نرم‌افزار است: تبدیل کردن فرایند ساختن سیستم پایگاه دانش از قالب هنر به دیسیپلین مهندسی است. این کار نیازمند آنالیز فرایند ساختاری خودش و توسعه متدها، زبان‌ها و ابزاری مناسب و خاص برای توسعه سیستم پایگاه دانش است [20]. مهندسی دانش شامل همکاری خبره‌ها در دامنه کاری با مهندس دانش است تا قوانین ضمنی ساخته و کد شوند که افراد خبره از آن در حل مسائل واقعی استفاده می‌کنند. که این رشته به مهندسی نرم‌افزار مربوط است [19]. توسعه سیستم‌های پایگاه دانش فرایندی انتقالی از دانش بشر به پیاده‌سازی پایگاه دانش است. این انتقال بر اساس این فرضیه استوار است که دانش مورد نیاز سیستم KBS در حال حاضر موجود است و فقط باید جمع‌آوری و پیاده‌سازی شود. دانش مورد نیاز معمولاً از طریق خبره‌ها که چگونه آن‌ها وظایف خاص را حل می‌کنند بدست می‌آید [20].
به مهندسی دانش از دو دیدگاه می‌توان نگریست: محدود و وسیع. از دیدگاه محدود مهندسی دانش با کسب، ارائه، ارزیابی، استنتاج، تفسیر و نگه‌داری دانش سروکار دارد. در عوض، بر اساس دیدگاه وسیع، این اصطلاح تمام فرایند توسعه و نگه‌داری سیستم‌های هوشمند را توضیح می‌دهد.
دانش استفاده‌شده توسط افراد خبره اغلب غیر ساختار یافته و غیر صریح است. هدف اصلی مهندسی دانش کمک به خبره‌ها است که آنچه را که می‌دانند به صورت ماهرانه بیان کنند و اینکه دانش را در قالبی قابل استفاده و درک مستندسازی کنند [19].
[do_widget id=kl-erq-2]

جدول 1-2 تفاوت سیستم‌های خبره با سیستم‌های متعارف…………………………………………….33
جدول 2-2: مفاهیم سیستم‌های خبره و متعارف ……………………………………………………………34
جدول 4-1 مقایسه روش کاوش ایده با دیگر روشها در مکانیزه کردن کشف دانش…………..64
فهرست تصاویر و نمودارها
عنوان صفحه
شکل 2-1: فرایند رویکرد کاوش ایده……………………………………………………………………………21
شکل 2-2: چارچوب نوآوری- معماری سیستم…………………………………………………………….31
شکل 3-2 : ساختار سیستم خبره………………………………………………………………………………….35
شکل 4-2 : فرایند مهندسی دانش…………………………………………………………………………………39
شکل 1-4: استفاده از روش کاوش ایده در فرایند مهندسی دانش……………………………………..56
فصل اول: مقدمه و کلیات تحقیق
1- 1 مقدمه:
حجم اطلاعات در سال‌های اخیر با رشد چشمگیری در حال افزایش است و از طرفی سازمان‌ها و شرکت‌ها نیز هر روزه با مسائل و مشکلات جدید روبه‌رو می‌شوند که شاید راه‌حل بسیاری از این مسائل در این توده عظیم اطلاعات باشد که در جای جای دنیا در بستری به نام اینترنت پراکنده شده و یا به صورت اسناد، مقالات، گزارشات و… در بایگانی شرکت‌ها و سازمان‌ها قرار دارد. بسیاری از سازمان‌ها با استفاده از افراد خبره در زمینه‌های مختلف سعی بر آن داشته که بتوانند راه‌حل‌هایی برای این مسائل پیدا کنند که مطمئناً زمان‌بر و پر هزینه خواهد بود. روش کاوش ایده راه‌حلی برای این موضوع است تا با پیدا کردن راه‌حل برای مسایل موجود به صورت مکانیزه در زمان و هزینه به صورت کارا صرفه‌جویی کنیم. کاوش متن یا کشف دانش از متن‌ها به صورت کلی به فرایند استخراج اطلاعات و دانش مفید از متن‌های غیر ساختار یافته ارجاع داده می‌شود. با ارجاع به این کاوش ایده، فرایند اتوماتیکی برای استخراج ایده‌های مفید و جدید از متن غیر ساختار یافته با استفاده از متدهای کاوش متن است و هدف این روش اگرچه پیدا کردن ایده‌های جدید و مفید است اما اغلب ارائه دادن این ایده‌ها به صورت قابل درک برای کاربر است [7,8]. این روش در وزارت دفاع آلمان برای اولین بار به کار گرفته شد و با استفاده از افراد خبره مورد ارزیابی قرار گرفت. نتایج حاصل از این تحقیق نشان داد که این روش کارایی لازم را دارد اگرچه به دلیل حساس بودن نتایج برای وزارت دفاع المان این نتایج مخفی ماند اما در نهایت این روش برای مسایل مختلف در این وزارت مورد استفاده قرار گرفت و راه‌حل‌های مفیدی را برای مسائل مختلف آن پیدا کرد.
1-2 تعریف مسأله و سوالات اصلی تحقیق
در راستای پیاده سازی و استفاده از روش کاوش ایده سوالات زیر را می‌توان مطرح کرد:
دلیل استفاده از این روش به جای روش‌های دیگر از جمله ضریب جکارد چیست؟
چه روش‌های دیگری غیر از این روش وجود دارند؟
این روش در چه زمینه‌هایی کاربرد دارد؟
آیا پیاده‌سازی این روش به زبان فارسی قابل ارزیابی است؟
ایده‌های بدست آمده از این روش به چه میزان مفید و جدید هستند؟
آیا میتوان در زمینههای دیگر از این روش استفاده کرد؟

1-3 فرضیه‌ها [do_widget id=kl-erq-2]
در این مسأله فرض بر این است که یک مسأله وجود دارد و متن‌های زیادی در قالب مقالات، اسناد، گزارشات و … وجود دارند که احتمالاً راهحل این مسأله در آن‌ها وجود دارد، هدف پیدا کردن راه‌حل این مسأله از این متن‌ها به وسیله یک رویکرد خودکار است که سبب می‌شود استخراج ایده‌ها و راه‌حل‌ها بسیار سریع‌تر و ارزان‌تر انجام شود.
1-4 موضوع و اهداف پژوهش
هدف از این پایان‌نامه ایجاد برنامه کاربردی روش کاوش ایده به زبان فارسی است تا بتوان از منابع و مقالات موجود به زبان فارسی ایده‌های جدید و مفید را برای حل مسأئل موجود پیدا کرد. همچنین استفاده از این روش در پیادهسازی سیستمهای خبره است در واقع از این روش برای گرداوری دانش در فرایند مهندسی دانش استفاده شود تا این روش را هر چه بیشتر کاربردی شود.
1-5 روش تحقیق
روش انجام این تحقیق مطالعه و گرداوری اطلاعات لازم در زمینه روش کاوش ایده است که نتایج را می‌توان با نمونه انگلیسی آن ارزیابی کرد و همچنین مطالعه در زمینه سیستمهای خبره است که این روش می‌تواند به بهبود مراحل مهندسی آن کمک کند.
1-6 جنبه‌های نوآوری
با پیاده‌سازی این روش به زبان فارسی یکی از روش‌های جدید در زمینه متن‌کاوی برای متون فارسی وجود خواهد داشت و با به کار بردن آن در سیستمهای خبره راه جدیدی برای گردآوری دانش و غنی سازی پایگاه دانش به وجود خواهد آمد.
1-7 مراحل انجام تحقیق
مطالعات اولیه و ادبیات مسأله
شناخت مسأله و پیاده سازی آن
ارزیابی آن با استفاده از مقالات موجود
مطالعه کاربرد روش در زمینه‌های مختلف
بیان کاربرد جدید برای این روش
1-8 مروری اجمالی به چندی از تحقیقات و مطالعات انجام گرفته
روش کاوش ایده اولین بار در سال 2008 توسط Dirk Thorleuchter, Dirk Van den Poel در یک پروژه تحقیقی برای وزارت دفاع آلمان معرفی شد که از تکنیک‌های کاوش متن برای بدست آوردن ایده‌های جدید استفاده کردند [8].آن‌ها در سال 2009 رویکرد کاوش ایده را با درجه دقت بیشتری ارائه دادند. برای این رویکرد بر اساس فرضیات موجود برنامه کاربردی طراحی شده و روی اینترنت قرار داده شده است. در این سایت که چندین زبان را پشتیبانی می‌کند می‌توان کاربرد این روش را مشاهده کرد بدین منظور تنها لازم است که کاربر متنی که مسأله را بیان کرده و متنی که احتمال وجود راه‌حل برای مسأله مورد نظر در آن است را وارد کند تا در نهایت جواب را دریافت کند که به صورت متنی است که ایده‌های جدید پیدا شده در متن را به صورت جمله به کاربر نشان می‌دهد [7]. بعد از اینکه این روش مطرح شد استفاده‌های مختلف از آن در زمینه‌های گوناگون مطرح شد. در مقاله [9] از روش کاوش ایده به منظور ایجاد سرویس‌های جدید برای بهبود کسب و کار با استفاده از اطلاعات موجود در اینترنت و مقاله‌های تحقیقی استفاده می‌کند. در واقع از این روش به منظور هدف‌گرا کردن جستجو در صفحات وب به جای استفاده از موتورهای جستجوی ساده استفاده می‌کنند تا بتوانند بحث‌های کاربران را در وبلاگ‌ها و پیام‌ها شناسایی و پردازش کنند و همچنین بتوانند آیتم‌های جدیدی که مورد علاقه کاربران واقع شده است را شناسایی کنند و با استفاده از این کاوش سرویس‌های جدید را به منظور رقابت با رقبا ارائه می‌دهد و همچنین مقاله‌ [10,11]است که در آن از کاوش ایده به منظور نوآوری در محصول و توسعه و تحقیق درباره محصول جدید با استفاده از کاوش متن‌های اینترنتی که بیانگر نیازهای مصرف‌کنندگان است استفاده می‌کند و علاوه بر آن از روش کاوش ایده به منظور کاوش وب برای پیدا کردن مشتریان و شرکت‌های سودآور استفاده می‌کند.
1-9 ساختار پایان‌نامه
در فصل دوم به بیان مقدمه و تاریخچه روش کاوش ایده و کاربرهای آن و سیستمهای خبره و مراحل مهندسی آن پرداخته می‌شود.
فصل سوم، به چگونگی ارزیابی روش داده‌های مورد نیاز برای آن و نحوه تجزیه و تحلیل آن می‌پردازد.
فصل چهارم، با توجه به روش کاوش ایده نحوه استفاده از آن در متون فارسی و کاربرد آن در سیستمهای خبره را بیان می‌کند.
فصل پنجم، شامل جمع‌بندی و ارائه پیشنهاداتی برای تحقیقات آینده است.

فصل دوم: ادبیات تحقیق
2-1 مقدمه [do_widget id=kl-erq-2]
روش کاوش ایده روشی است که از تکنیک‌های کاوش متن و تکنیک جدیدی به نام کاوش ایده برای بدست آوردن ایده‌های جدید از متون غیر ساختار یافته استفاده می‌شود. این روش که در وزارت دفاع المان برای اولین بار ایجاد و به کار برده شد متنی که حاوی توضیح مسأله مطرح شده و متنی که احتمالاً ایده جدید برای حل این مسأله در آن مطرح شده است را به عنوان ورودی‌هایش دریافت می‌کند و با استفاده از تکنیک‌های که به کار می‌برد ایده‌های جدید و مفید را استخراج می‌کند و در نهایت با استفاده از روشی قابل درک برای کاربر آن را در خروجی نمایش می‌دهد.
ما در این تحقیق ابتدا در بخش 2-2 مروری اجمالی بر کاوش متن خواهیم داشت تا در مورد پایه و اساس روش کاوش ایده که کاوش متن است بحث کنیم. که در این قسمت بیشتر، کلیات کاوش متن که در کاوش ایده مورد استفاده قرار گرفته است را مورد بحث قرار می‌دهیم. در بخش بعدی تعریف ایده را بیان می‌کنیم تا با این کار از شبه‌هایی که در زمینه این واژه ممکن است وجود داشته باشد پرهیز کنیم و بتوانیم بر اساس این تعریف دامنه کار را بهتر مشخص کنیم. در بخش 2-4 به بررسی اساس و پایه ایجاد ایده می‌پردازیم تا بتوانیم نحوه به وجود آمدن این روش و در واقع ایده به وجود آمدن این روش را بهتر درک کنیم. در بخش 2-5 روش کاوش ایده را مورد بحث قرار می‌دهیم که مراحل مختلف این روش را به طور کامل شرح می‌دهد. در بخش 2-5-1 به ارزیابی روش کاوش ایده می‌پردازیم تا بتوانیم میزان دقت و صحت این روش را ببینیم.
در بخش بعدی کاربردهای کاوش ایده را بیان می‌کنیم. که در بخش 2-6-1 به کاربرد این روش در زمینه کسب و کار و برای یافتن سرویس‌های جدید اشاره خواهیم کرد. در بخش 2-6-2 کاربرد این روش در توسعه و تحقیق محصول جدید را بیان می‌کنیم. از آنجایی که ایده من در این مقاله علاوه بر پیاده‌سازی این روش به زبان فارسی به کار بردن آن در زمینه توسعه سیستمهای خبره است در بخش 2-7 مروری بر مفهوم سیستمهای خبره خواهیم داشت و در بخش 2-7-1 فرایند مهندسی دانش را مورد بررسی قرار می‌دهیم. در ادامه در قسمت 2-7-2 مراحل مهندسی دانش و در نهایت در بخش 2-7-2-1 مرحله کشف دانش را بیان خواهیم کرد.
2-2 کاوش متن
تکنیک کاوش متن به استخراج اتوماتیک اطلاعات از داده‌های متنی غیر ساختار یافته تخصیص داده می‌شود. تفاوت عمده کاوش متن با داده‌کاوی این است که داده‌کاوی استخراج اطلاعات از پایگاه داده‌های ساختار یافته است در حالیکه کاوش متن روی متن‌های غیر ساختار یافته کار می‌کند. کاوش متن برای کشف و استخراج اطلاعات از ساختار ضمنی متن‌ها به کار می‌رود و در پردازش زبان طبیعی نیز مورد استفاده قرار می‌گیرند [12].در واقع کاوش متن بخش خاصی از داده‌کاوی است که به عنوان فرایندی که اطلاعات با کیفیت بالا را از متن‌ها بدست می‌آورد به حساب می‌آید. کاوش متن یک فرایند سه مرحله‌ای است که متن ورودی را در اولین مرحله ساختار یافته می‌کند، الگوهای جدید و مشاهده نشده را در داده‌های متنی ساختار یافته در مرحله دوم شناسایی می‌کند و در مرحله سوم، نتایج را ارزیابی و تفسیر می‌کند [12].معمولاً مرحله اول در بسیاری از موارد کاربرد کاوش متن سیر یکسانی را دنبال می‌کند اما مرحله دوم و سوم بنا بر نیاز زمینه‌های خاص با هم متفاوت است. ابزارهای کاوش متن طی این سه مرحله ساخته می‌شوند و در زمینه‌های مختلف مورد استفاده قرار می‌گیرند. در مرحله اول که همان مرحله پیش پردازش است متن اولیه پاک‌سازی می‌شود (مثلاً از عکس یا تگ‌ها و… ). نشانه‌گذاری‌ها حذف و فرهنگ لغتی برای تصحیح خطاهای نوشتاری به کار برده می‌شود. سپس شناسه‌ها جدا می‌شوند که واحد اصطلاح کلمه است و تبدیل حروف (تبدیل اصطلاحات به حروف کوچک و بزرگ کردن کاراکتر اول جمله در زبان‌های که دارای حروف بزرگ و کوچک هستند) اعمال می‌شود.
معمولاً در قسمت فیلتر کردن متن چندین روش به کار می‌رود. ادات سخن نشانه‌گذاری شده برای شناسایی گروه نحوی اصطلاحات به کار برده می‌شود. فیلتر کلمات عمومی اغلب برای شناسایی اصطلاحات با اطلاعات کم یا بدون مضمون استفاده می‌شود. با ریشه‌یابی بر اساس فرهنگ لغت ریشه کلمات (جایی که ریشه مشابه کلمات مرتبط ارائه می‌شود) شناسایی می‌شود.
مضافاً توزیع زیف برای کاهش تعداد اصطلاحات با استفاده از حذف اصطلاحات کمیاب به کار برده می‌شود. بعد از این کار اصطلاحات انتخاب شده به صورت دستی چک می‌شوند. سپس بردارهای متنی ساخته می‌شوند. در مرحله دوم از این بردارهای متنی با شیوه‌های مختلف جهت استخراج اطلاعات استفاده می‌شود تا الگوهای جدید را کشف کند. که در نهایت این الگوها برای ارزیابی میزان مفید بودنشان در مرحله سوم مورد ارزیابی قرار می‌گیرند.
ابزار کاوش متن در این فرایند سه مرحله‌ای ساخته می‌شوند تا بتوان از آن در زمینه‌های مختلف بهره جست. همان‌طور که حجم داده‌های غیر ساختار یافته در حال افزایش است، ابزار کاوش متن که آن‌ها را وارسی می‌کند به صورت فزاینده با ارزش می‌شوند. برای مثال، ابزارهایی که در زمینه‌های پزشکی به کار گرفته می‌شوند، که حجم اطلاعات در موضوع خاصی سبب شده که این کار برای یک محقق غیر ممکن باشد که تمام آن‌ها را کشف کند. روش‌های کاوش متن اغلب برای دولت و آژانس‌های امنیتی که سعی دارند هشدارهای تروریستی و دیگر تهدیدهای امنیتی را قبل از اینکه شانس رخ دادن داشته ب
اشند را پیدا کنند، مفید است، آموزش، حیطه دیگری است که کاوش متن در آن بسیار مفید واقع شده است. دانش‌آموزان و آموزگاران بهتر قادر خواهند بود که اطلاعات مربوط به موضوع‌هایشان را نسبت به روش‌های سنتی پیدا کنند. برای محققان کاوش متن، کاربردهای تجاری می‌توانند هدف بسیار امیدبخشی باشد. ابزارهای کاوش متن می‌تواند به شرکت‌ها در آنالیز رقیبانشان، پایگاه مشتری و استراتژی‌های بازاریابی کمک کند [13]. این تنها قسمتی از کاربردهای کاوش متن است و استفاده از آن در تمام زمینه‌ها به سرعت در حال افزایش است. اهمیت فزاینده کاوش متن در مقابل رشد چشمگیر حجم اطلاعات بیشتر نمایان می‌شود و محققان در همه زمینه‌ها به اهمیت استفاده از این روش برای رقابت و پیشی گرفتن در بازارهای جهانی واقف هستند.
2-3 ایده چیست
ما در اینجا ایده را از دیدگاه تکنولوژیکی تعریف می‌کنیم. در این دیدگاه تعریف ایده ترکیبی از دو چیز است: معنی و هدف وابسته. مثالی برای ایده ترانزیستور است. ترانزیستور وسیله‌ای نیمه رسانا است که می‌تواند به منظور تقویت یا سوئیچ سیگنال‌های الکترونیکی به کار برده می‌شود. در اینجا ما معنی (وسیله نیمه رسانا) و هدف وابسته (تقویت یا سوئیچ سیگنال‌های الکترونیکی) را داریم. به طور کلی در اینجا بحث از یک ایده جدید است به این معنی که اگر معنی شناخته شده مربوط به هدفی ناشناخته باشد یا اگر هدف شناخته شده مربوط به معنی ناشناخته باشد. بنابراین ایده جدید می‌تواند نانو مگنت باشد زیرا نانو مگنت آهنربای کوچک شده‌ای است که می‌تواند برای تقویت یا سوئیچ سیگنال به کار رود. در این مثال معنی ناشناخته نانو مگنت و هدف شناخته شده تقویت سیگنال را دایم. این ایده جدید می‌تواند مفید باشد زیرا در آینده نانو مگنت می‌تواند جایگزین ترانزیستور شود [7]. بنابراین ایده تکنولوژیکی تنها معنی جدید را ارائه نمی‌دهد بلکه اغلب هدف جدید و معنی ترکیبی را بیان می‌کند. به وسیله شناسایی سیستماتیک هدف‌ها، معنی‌ها و ترکیب هدف و معنی در متن‌های تکنولوژیکی غیر ساختار یافته، جستجوگر اتوماتیکی ایده می‌تواند به کار برده شود. در واقع همین ایده‌های جدید اساس پروژه‌های تحقیقی جدید هستند. این به این معنی است که برای طرح‌ریزی برنامه پروژه‌های تحقیقی لازم است که ایده‌های تکنولوژیکی جدید از جامعه علمی به عنوان اساس پروژه‌های تحقیقی آینده شناسایی شود [8].
در این تحقیق به واژه ایده با چنین تعریف و دیدگاهی نگریسته می‌شود و هدف در اینجا پیدا کردن ایده‌های جدید است تا بتواند پایه‌ای برای تحقیقات آینده و حل مسائلی باشد که پیش خواهند آمد.
2-4 اساس و پایه در پشت ایجاد ایده
ایجاد ایده یک موضوع شناخته شده است که مرتبط با خلاقیت در علم شناخت و روان شناسی است. توضیح اولیه فرایند خلاق به وسیله (Wallws) انتشار یافت. مدل مرحله‌ای او بینش‌های خلاق و اشراق را برای پیدا کردن راه حل مسأله توضیح می‌دهد. این مدل شامل فرایندی 4 مرحله‌ای است. در مرحله اول «آماده سازی» مسأله آنالیز می‌شود. به طوری که شخص نحوه ایجاد مسأله را تشخیص می‌دهد.
مرحله دوم «نهفتگی/ علامت» و مرحله سوم «روشن سازی» مسأله را از ذهن آگاه به ذهن نا خود آگاه انتقال می‌دهد. ذهن ناخود آگاه روی مسائل آگاهانه کار می‌کند و شاید راه حل را به وسیله بینش‌ها و روشن سازی‌های خلاق پیدا کند. این راه حل به ذهن آگاه انتقال می‌یابد، به این معنی که بعد از مدتی شخص ناگهان یک ایده دریافت می‌کند که برای او جدید است و شاید مسأله را حل کند.
در مرحله آخر «ارزیابی»، ایده برای تازگی و سودمندی تست خواهد شد.
یکی از بهترین روش‌های شناخته شده عمل گرایی استفاده از خلاقیت عملی، طوفان فکری است.
مرحله اول در طوفان فکری، تعریف مسأله به وسیله ایجاد توضیحات مسأله است. سپس، اشخاص ایده‌های جدید را با استفاده از روش‌های خلاقانه مانند ارتباط ایده و غیره تولید می‌کنند.
مرحله‌ی آخر در فرایند طوفان فکری خوشه بندی ایده‌های تولید شده و ارزیابی آن برای تازگی و سودمندی است.
علاوه بر این، چندین رویکرد دیگر در ارتباط با خلق ایده جدید وجود دارد. ما می‌توانیم از تمام این رویکردها یاد بگیریم که برای خلق ایده‌ها سه مرحله ضروری است.

در روش کاوش ایده، از طول ثابت، برای الگو استفاده نمی‌شود بلکه از طول متغیر الگوهای متنی بر اساس وفق دهی پویا با متنش استفاده می‌شود.
در این روش از شمای توزین اصطلاحات بر اساس تفاوت بین کلمه‌های عمومی و کلمه‌های غیر عمومی و با توجه به اینکه اهمیت کلمات عمومی به اندازه اهمیت کلمه‌های غیر عمومی بالا نیست استفاده می‌شود. اگر نویسنده ایده را بسیار خلاصه به وسیله پیوستن کلمه‌های اصلی به هم فرموله کند پس به صورت نرمال از بسیاری از کلمه‌های عمومی استفاده نمی‌کند و طول الگوی متن می‌تواند کوچک باشد. اگر نویسنده متن را با سبک گل و بلبل فرموله کند به این معنی که نوشته‌اش را با روش واضح و ساده بیان نکند پس او به صورت نرمال از کلمه‌های عمومی زیادی استفاده می‌کند و الگوی متنی باید بزرگ‌تر باشد. در روش کاوش ایده مقدار طول الگوی متن L و u درصد اهمیت کلمه‌ی عمومی و v درصد اهمیت کلمه‌های غیر عمومی می‌تواند به وسیله کاربر اعمال شود. [do_widget id=kl-erq-2]
برای محاسبه تغییر طول الگوی متن باید اول شمای توزین اصطلاح را تعریف کنیم.
تعریف 1: I=[wI …, wn] یک لیست از اصطلاحات (کلمات) wi در ترتیب ذکر شده و nتعداد اصطلاحات در T است و I ، E= [] یک مجموعه ازاصطلاحات در است. درصد U ضریب وزن اصطلاح برای کلمه عمومی است. درصد V ضریب وزن اصطلاح برای کلمه غیرعمومی است. پس ما Fg(w i) را به عنوان شمای وزن اصطلاحات تعریف می‌کنیم.
F g(w i)=
ما یک مثال برای این ارائه می‌دهیم. الگوی متن:
موبایل برای انتقال داده از مادون قرمز
در اطراف کلمه داده ساخته شده است. که این شامل خود کلمه‌ی داده و چهار کلمه از متن قبل از آن، و چهار کلمه از متن بعد از آن است.
اینجا، ما از طول ثابت 4=L استفاده کرده‌ایم و شمای وزنی اصطلاح با %100 = =. این به این معنی است که اهمیت کلمه عمومی و غیرعمومی با هم برابر است. الگوی متن بعدی مثال طول متغیر است.
“که در اولین فاز موجود در آن که از مواد و تکنولوژی‌هایی مانند سیستم‌های لایه‌ای و کریستال‌ها”
این الگوی متن در اطراف کلمه “تکنولوژی‌هایی” ساخته شده است. اینجا ما از طول ثابت L=3 استفاده کردیم و شمای وزنی اصطلاح با U=10X و V=100Y استفاده کردیم. به عنوان نتیجه این الگوی متن شامل 6 اصطلاح برای متن راست و 11 اصطلاح برای متن چپ اصطلاح “تکنولوژی‌هایی” است. در این مثال، کلمه‌های غیر عمومی، فاز، مواد، تکنولوژی، سیستم، لایه و کریستال هستند که تعداد اصطلاحات را از متن چپ و راست به صورت زیر محاسبه کردیم.
تعریف 2: L ثابت برای الگوی متنی است Li left تعداد اصطلاح‌ها از متن چپ الگوی متنی است که در اطراف اصطلاح Wi ساخته شده است. Li right تعداد اصطلاحات از متن راست الگوی متنی است که در اطراف اصطلاح Wi ساخته شده است. پس ما
Li left N و Li right N را به صورت زیر تعریف می‌کنیم.
بعد از محاسبه Li left و Liright از متن جدید، بردار اصطلاح را در مدل فضای برداری ایجاد می‌کنیم. اندازه‌ی بردار به وسیله تعداد اصطلاحات متفاوت فیلتر شده کلمات عمومی در ریشه‌ها در متن جدید بدست می‌آید. برای رمز گذاری الگوی متنی، از بردارهای متنی باینری استفاده می‌کنیم که به این معنی است که عضوهای بردار برابر 1 هستند اگر اصطلاح غیر ریشه‌ای مشابه در الگوی متن استفاده شود و 0 اگر اصطلاح نباشد. که اغلب الگوی متنی را از شرح مسأله می‌سازیم و بردار را از طریقی که در بالا بیان شد ایجاد می‌کنیم.
با روش کاوش ایده، ما برداری که الگوی متن را ارائه می‌دهد از متن جدید با مشابه‌ترین بردارهایش از شرح مسأله را به منظور تشخیص اینکه جدید و مفید است مقایسه می‌کنیم. ابتدا باید الگوی متنی را از متن جدید پیدا کنیم که تمام اصطلاحات معنی (هدف) را ارائه دهند و هیچ اصطلاحی در هدف (معنی) که در الگوی متن از شرح مسأله ارائه می‌شود نداشته باشد. اگر تمام الگوهای متن از متن جدید شناخته شده باشند. به این معنی که تمام اصطلاحات در الگوی متنی از شرح مسأله رخ داده باشد. پس ایده برای کاربر جدید نیست بنابراین ایده مفید نیست اگر تمام اصطلاحات در الگوی متن از متن جدید ناشناخته باشند زیرا هیچ ارتباطی به مسأله ندارد؛ و این در m2 نشان داده شده است که برای یافتن ایده جدید و مفید، تعداد اصطلاحات شناخته شده و تعداد اصطلاحات ناشناخته باید متوازن باشند.
تعریف 3: مجموعه از اصطلاحات فیلتر شده‌ی کلمات عمومی و ریشهای ارائه شده در الگوی متنی با شماره i از متن جدید است. مجموعه از اصطلاحات فیلتر شده کلمات عمومی و ریشه ای ارائه شده در الگوی متنی با شماره j از شرح مسأله است. مجموعه ای اصطلاحات فیلتر شده کلمات عمومی و ریشه ای از متن جدید است. X= || درجه است.
{1 , 1 بردار اصطلاح از مدل فضای برداری در رابطه با است.
{0,1 بردار اصطلاح از مدل فضای برداری در رابطه با است.
P=|| = تعداد تمام اصطلاحات در الگوی متنی با شماره i است.
q=| تعداد اصطلاحات شناخته شده در الگوی متن با شماره i در رابطه با الگوی متن با شمارۀ متن با شمارۀ j در شرح مسأله است.
پس 1m را به عنوان اندازه گیری توزیع متوازن اصطلاحات شناخته شده و ناشناخته به صورت زیر تعریف می‌کنیم.
اصطلاحات شناخته شده در الگوی متن از متن جدید باید در شرح مسأله بسیار متناوب‌تر از بقیه اصطلاحات رخ داده باشند. این به این دلیل است که آن‌ها معنی شناخته شده یا هدف شناخته شده را ارائه می‌دهند که بخش اصلی از مسأله است. در شرح مسأله اصطلاحاتی که مسأله را ارائه می‌دهند بسیا
ر متناوب‌تر از بقیه تکرار می‌شوند. برای همین، ما این اصطلاحات متناوب را به وسیله استفاده از درصد Z به عنوان پارامتر تعریف می‌کنیم و m2 را به عنوان تعداد اصطلاحات شناخته شده و متناوب در کنار تعداد کل اصطلاحات بدست می‌آوریم.
تعریف 4:
Z درصد است. مجموعه از %Z اصطلاحات فیل‌تر شده‌ی کلمات عمومی و ریشه‌ای بسیار متناوب در شرح مسأله است. بردار متنی در مدل فضای برداری در رابطه با است. r= | تعداد اصطلاحات شناخته شده است که به طور متناوب در شرح مسأله رخ می دهند. m2 را به عنوان معیار اندازه گیری برای رخ دادن متفاوت اصطلاحات شناخته شده در شرح مسأله تعریف می‌کنیم.
اصطلاحات ناشناخته در الگوی متن از متن جدید رویکرد جدید ارائه می‌دهند، که بخش اصلی از ایده جدید است. این اصطلاحات به صورت نرمال بسیار متناوب‌تر از بقیه اصطلاحات در متن جدید رخ می‌دهند زیرا این متن با ایده جدید سروکار دارد. برای همین، ما اغلب این اصطلاحات متناوب را به وسیله استفاده از درصد Z به عنوان پارامتر تعریف می‌کنیم و. را به عنوان تعداد اصطلاحات متناوب ناشناخته در طول تعداد کل اصطلاحات ناشناخته محاسبه می‌کنیم.

تعریف 5: 𝛗 مجموعه‌ای از %Z از اصطلاحات فیل‌تر شده کلمات عمومی و ریشه‌ای بسیار متناوب در متن جدید است. τ بردار متنی در مدل فضای بردار در رابطه با 𝛗 است.
S=| [do_widget id=kl-erq-2]
تعداد اصطلاحات ناشناخته است که به طور متناوب در متن جدید رخ می‌دهد، ما m3 را به عنوان معیار اندازه گیری برای رخداد متناوب اصطلاحات ناشناخته در متن جدید تعریف می‌کنیم.
بعضی کلمه‌ها (مانند بیشترین، مهم‌ترین، ماکزیمم، مینیمم و …)در یک عبارت اغلب بیانگر رخ دادن ایده جدید در آن عبارت هستند. آن‌ها به هدف متغیر یا معنی متغیر اشاره می‌کند و می‌توانند شاخصی برای ایده جدید باشد.
تعریف :6 مجموعهای از این اصطلاحات خاص است. [0,1 𝝷 بردار اصطلاح در مدل فضای اصطلاح در رابطه با است.= F=| تعداد این اصطلاحات خاص در الگوی متنی با شماره i است. ما m4 را به عنوان معیار اندازه گیری برای هدف و معنا متغییر در نظر می گیریم.
m4=
معیار اندازه گیری کاوش داده بستگی به تمام چهار زیر معیار اندازه گیری اکتشافی است.
تعریف 7: h={1, … , 4} و فاکتور وزنی با معیار اندازه گیری کاوش ایده مجموع تمام این چهار زیر معیار ضرب شده در فاکتور های وزنی gh در حالتی است که pq:
M=
نتایج در زیر معیارهای سوم و دوم بستگی به پارامترها دارد. این پارامترها تفاوت تناوب اصطلاحات در مسأله است مجموعه %Z از بیشترین تناوب اصطلاحات فیل‌تر شده استفاده می‌شوند.
در روش کاوش ایده به صورت ابتکاری تعیین شد که این پارامتر باید بین %10 با %30 باشد تا زیر معیارهای خوبی بدست آورد. این به این دلیل است که اگر Z بیشتر از 30% باشد پس ما شاید چندین اصلاح را دسته بندی کنیم که تنها یک‌بار به عنوان اصطلاح متناوب رخ داده‌اند؛ و اگر Z کمتر از %10 باشد ما تنها اصطلاحات بسیار متناوب را برای مجموعه شناسایی می‌کنیم. بنابراین، Z را مقدار میانگین قرار دادند (%20).
به علاوه، مشاهده کردیم که زیر معیارهای 3 و 2 به یک اندازه موفق هستند و زیر معیار چهارم کمتر موفق است بنابراین به صورت ابتکاری پارامتر. را %50 و %20= و %20= و %10= قرار دادند.
سپس، تعیین شد که مقدار برش آلفا α معیار اندازه گیری کاوش ایده m باشد. اگر درصد α کوچک باشد پس اصطلاحات نتیجه‌ی بسیاری بدست می‌آید. این منجر می‌شود که مقدار دقت کوچک باشد زیرا بسیاری از الگوهای متنی استخراج شده شامل ایده جدید و مفید نیستند اگر α بزرگ باشد پس تنها تعداد کمی از نتایج را خواهیم داشت و احتمالاً مقدار برگشتی ما کوچک خواهد بود زیرا ما بسیار از ایده‌های مفید و جدید را در متن جدید پیدا نکردیم. اشخاص خبره نتایج چندین متن را برای مقدار بهینه چک کردند. آن‌ها به این تجربه دست یافتند که 60% یک سازش خوب است بنابراین، α را 60% قرار دادند[7].
4-3 استفاده از روش کاوش ایده در فرایند مهندسی دانش
همان طور که در بخش شرح دادیم یکی از مشکل‌ترین مراحل فرایند مهندسی دانش، کشف دانش است. در این مرحله که به گرداوری دانش پرداخته می‌شود چون منابع گرداوری زیاد هستند به عنوان مرحله‌ای زمان‌بر و پرهزینه قلمداد می‌شود لذا سعی بر آن بوده که بتوانند این مرحله هر چه بیشتر مکانیزه کنند. همان‌طور که در آن بخش شرح دادیم از جمله این منابع سندها، گزارشات، فرم‌ها و… هستند که مهندس دانش باید از لابه‌لای آن‌ها دانش مورد نظر را پیدا کرده و مستندسازی کند. از طرفی باید از خبره‌ها نیز کمک بگیرد. استفاده از روش کاوش ایده در پیدا کردن دانش از لابه‌لای متون می‌تواند مفید باشد خصوصاً برای سیستم‌های خبره‌ای که به صورت پرسش و پاسخ بوده و سعی در حل کردن مسائل مربوطه را دارند. مثلاً سیستم رفع عیب ماشین را در نظر بگیرید که قرار است توسط مهندس دانش طراحی شود. علاوه بر خبره‌ها در این زمینه مستندات زیادی در قالب متن نیز وجود دارند. خبره می‌تواند یک شرح اولیه از مشکلات ماشین تهیه کند و به عنوان شرح مسأله به برنامه کاوش ایده بدهید و از طرف دیگر مستندات موجود را به عنوان متن جدید ارائه دهد همان‌طور که می‌دانیم روش کاوش ایده با سرعت زیاد به کاوش متون پرداخته و ایده‌های جدید را از لابه لای آن پیدا می‌کند و حتی می‌توان برای غنی سازی پایگاه دانش از سایت‌های مرتبط با مسأله استفاده کرد و این به این دلیل است که دیگر مهندس دانش دستی این کار را انجام نمی‌دهد بلکه از روشی مکانیزه استفاده می‌کند بنابراین می‌توان منابع را تا هر میزان که لازم است زیاد کرد. همان‌طور که در بخش شرح داده شد این روش نتایج بهتری از ضریب جکارد می‌دهد بنابراین روش مفیدتری نبست به آن خواهد بود. بنابراین می‌توان فرایند مهندسی دانش را به صورت شکل تغییر داد.
در شکل 1-4 از روش کاوش ایده برای کاوش در مستندات استفاده می‌کنیم و مهندس دانش از خبره‌ها برای جمع آوری دانش کمک می‌گیرد . ایده‌ها ابتدا ارزیابی می‌شوند و بعد به صورت دانش ارائه می‌شوند تا در پایگاه دانش ذخیره شوند. ارزیابی ایده‌ها باید توسط مهندس دانش صورت گیرد.
Knowledge
Validation
(test cases)
Sources of Knowledge
(experts)
Sources of Knowledge
(Documents, forms, …)
Idea mining
Idea evaluation