منابع و ماخذ مقاله موتورهای جستجو و سیستمهای خبره

دانلود پایان نامه

1-6 جنبه‌های نوآوری
با پیاده‌سازی این روش به زبان فارسی یکی از روش‌های جدید در زمینه متن‌کاوی برای متون فارسی وجود خواهد داشت و با به کار بردن آن در سیستمهای خبره راه جدیدی برای گردآوری دانش و غنی سازی پایگاه دانش به وجود خواهد آمد.
1-7 مراحل انجام تحقیق
مطالعات اولیه و ادبیات مسأله
شناخت مسأله و پیاده سازی آن
ارزیابی آن با استفاده از مقالات موجود
مطالعه کاربرد روش در زمینه‌های مختلف
بیان کاربرد جدید برای این روش
1-8 مروری اجمالی به چندی از تحقیقات و مطالعات انجام گرفته
روش کاوش ایده اولین بار در سال 2008 توسط Dirk Thorleuchter, Dirk Van den Poel در یک پروژه تحقیقی برای وزارت دفاع آلمان معرفی شد که از تکنیک‌های کاوش متن برای بدست آوردن ایده‌های جدید استفاده کردند [8].آن‌ها در سال 2009 رویکرد کاوش ایده را با درجه دقت بیشتری ارائه دادند. برای این رویکرد بر اساس فرضیات موجود برنامه کاربردی طراحی شده و روی اینترنت قرار داده شده است. در این سایت که چندین زبان را پشتیبانی می‌کند می‌توان کاربرد این روش را مشاهده کرد بدین منظور تنها لازم است که کاربر متنی که مسأله را بیان کرده و متنی که احتمال وجود راه‌حل برای مسأله مورد نظر در آن است را وارد کند تا در نهایت جواب را دریافت کند که به صورت متنی است که ایده‌های جدید پیدا شده در متن را به صورت جمله به کاربر نشان می‌دهد [7]. بعد از اینکه این روش مطرح شد استفاده‌های مختلف از آن در زمینه‌های گوناگون مطرح شد. در مقاله [9] از روش کاوش ایده به منظور ایجاد سرویس‌های جدید برای بهبود کسب و کار با استفاده از اطلاعات موجود در اینترنت و مقاله‌های تحقیقی استفاده می‌کند. در واقع از این روش به منظور هدف‌گرا کردن جستجو در صفحات وب به جای استفاده از موتورهای جستجوی ساده استفاده می‌کنند تا بتوانند بحث‌های کاربران را در وبلاگ‌ها و پیام‌ها شناسایی و پردازش کنند و همچنین بتوانند آیتم‌های جدیدی که مورد علاقه کاربران واقع شده است را شناسایی کنند و با استفاده از این کاوش سرویس‌های جدید را به منظور رقابت با رقبا ارائه می‌دهد و همچنین مقاله‌ [10,11]است که در آن از کاوش ایده به منظور نوآوری در محصول و توسعه و تحقیق درباره محصول جدید با استفاده از کاوش متن‌های اینترنتی که بیانگر نیازهای مصرف‌کنندگان است استفاده می‌کند و علاوه بر آن از روش کاوش ایده به منظور کاوش وب برای پیدا کردن مشتریان و شرکت‌های سودآور استفاده می‌کند.
1-9 ساختار پایان‌نامه
در فصل دوم به بیان مقدمه و تاریخچه روش کاوش ایده و کاربرهای آن و سیستمهای خبره و مراحل مهندسی آن پرداخته می‌شود.
فصل سوم، به چگونگی ارزیابی روش داده‌های مورد نیاز برای آن و نحوه تجزیه و تحلیل آن می‌پردازد.
فصل چهارم، با توجه به روش کاوش ایده نحوه استفاده از آن در متون فارسی و کاربرد آن در سیستمهای خبره را بیان می‌کند.
فصل پنجم، شامل جمع‌بندی و ارائه پیشنهاداتی برای تحقیقات آینده است.
فصل دوم: ادبیات تحقیق
2-1 مقدمه
روش کاوش ایده روشی است که از تکنیک‌های کاوش متن و تکنیک جدیدی به نام کاوش ایده برای بدست آوردن ایده‌های جدید از متون غیر ساختار یافته استفاده می‌شود. این روش که در وزارت دفاع المان برای اولین بار ایجاد و به کار برده شد متنی که حاوی توضیح مسأله مطرح شده و متنی که احتمالاً ایده جدید برای حل این مسأله در آن مطرح شده است را به عنوان ورودی‌هایش دریافت می‌کند و با استفاده از تکنیک‌های که به کار می‌برد ایده‌های جدید و مفید را استخراج می‌کند و در نهایت با استفاده از روشی قابل درک برای کاربر آن را در خروجی نمایش می‌دهد.
ما در این تحقیق ابتدا در بخش 2-2 مروری اجمالی بر کاوش متن خواهیم داشت تا در مورد پایه و اساس روش کاوش ایده که کاوش متن است بحث کنیم. که در این قسمت بیشتر، کلیات کاوش متن که در کاوش ایده مورد استفاده قرار گرفته است را مورد بحث قرار می‌دهیم. در بخش بعدی تعریف ایده را بیان می‌کنیم تا با این کار از شبه‌هایی که در زمینه این واژه ممکن است وجود داشته باشد پرهیز کنیم و بتوانیم بر اساس این تعریف دامنه کار را بهتر مشخص کنیم. در بخش 2-4 به بررسی اساس و پایه ایجاد ایده می‌پردازیم تا بتوانیم نحوه به وجود آمدن این روش و در واقع ایده به وجود آمدن این روش را بهتر درک کنیم. در بخش 2-5 روش کاوش ایده را مورد بحث قرار می‌دهیم که مراحل مختلف این روش را به طور کامل شرح می‌دهد. در بخش 2-5-1 به ارزیابی روش کاوش ایده می‌پردازیم تا بتوانیم میزان دقت و صحت این روش را ببینیم.
در بخش بعدی کاربردهای کاوش ایده را بیان می‌کنیم. که در بخش 2-6-1 به کاربرد این روش در زمینه کسب و کار و برای یافتن سرویس‌های جدید اشاره خواهیم کرد. در بخش 2-6-2 کاربرد این روش در توسعه و تحقیق محصول جدید را بیان می‌کنیم. از آنجایی که ایده من در این مقاله علاوه بر پیاده‌سازی این روش به زبان فارسی به کار بردن آن در زمینه توسعه سیستمهای خبره است در بخش 2-7 مروری بر مفهوم سیستمهای خبره خواهیم داشت و در بخش 2-7-1 فرایند مهندسی دانش را مورد بررسی قرار می‌دهیم. در ادامه در قسمت 2-7-2 مراحل مهندسی دانش و در نهایت در بخش 2-7-2-1 مرحله کشف دانش را بیان خواهیم کرد.
2-2 کاوش متن
تکنیک کاوش متن به استخراج اتوماتیک اطلاعات از داده‌های متنی غیر ساختار یافته تخصیص داده می‌شود. تفاوت عمده کاوش متن با داده‌کاوی این است که داده‌کاوی استخراج اطلاعات از پایگاه داده‌های ساختار یافته است در حالیکه کاوش متن روی متن‌های غیر ساختار یافته کار می‌کند. کاوش متن برای کشف و استخراج اطلاعات از ساختار ضمنی متن‌ها به کار می‌رود و در پردازش زبان طبیعی نیز مورد استفاده قرار می‌گیرند [12].در واقع کاوش متن بخش خاصی از داده‌کاوی است که به عنوان فرایندی که اطلاعات با کیفیت بالا را از متن‌ها بدست می‌آورد به حساب می‌آید. کاوش متن یک فرایند سه مرحله‌ای است که متن ورودی را در اولین مرحله ساختار یافته می‌کند، الگوهای جدید و مشاهده نشده را در داده‌های متنی ساختار یافته در مرحله دوم شناسایی می‌کند و در مرحله سوم، نتایج را ارزیابی و تفسیر می‌کند [12].معمولاً مرحله اول در بسیاری از موارد کاربرد کاوش متن سیر یکسانی را دنبال می‌کند اما مرحله دوم و سوم بنا بر نیاز زمینه‌های خاص با هم متفاوت است. ابزارهای کاوش متن طی این سه مرحله ساخته می‌شوند و در زمینه‌های مختلف مورد استفاده قرار می‌گیرند. در مرحله اول که همان مرحله پیش پردازش است متن اولیه پاک‌سازی می‌شود (مثلاً از عکس یا تگ‌ها و… ). نشانه‌گذاری‌ها حذف و فرهنگ لغتی برای تصحیح خطاهای نوشتاری به کار برده می‌شود. سپس شناسه‌ها جدا می‌شوند که واحد اصطلاح کلمه است و تبدیل حروف (تبدیل اصطلاحات به حروف کوچک و بزرگ کردن کاراکتر اول جمله در زبان‌های که دارای حروف بزرگ و کوچک هستند) اعمال می‌شود.
معمولاً در قسمت فیلتر کردن متن چندین روش به کار می‌رود. ادات سخن نشانه‌گذاری شده برای شناسایی گروه نحوی اصطلاحات به کار برده می‌شود. فیلتر کلمات عمومی اغلب برای شناسایی اصطلاحات با اطلاعات کم یا بدون مضمون استفاده می‌شود. با ریشه‌یابی بر اساس فرهنگ لغت ریشه کلمات (جایی که ریشه مشابه کلمات مرتبط ارائه می‌شود) شناسایی می‌شود.
مضافاً توزیع زیف برای کاهش تعداد اصطلاحات با استفاده از حذف اصطلاحات کمیاب به کار برده می‌شود. بعد از این کار اصطلاحات انتخاب شده به صورت دستی چک می‌شوند. سپس بردارهای متنی ساخته می‌شوند. در مرحله دوم از این بردارهای متنی با شیوه‌های مختلف جهت استخراج اطلاعات استفاده می‌شود تا الگوهای جدید را کشف کند. که در نهایت این الگوها برای ارزیابی میزان مفید بودنشان در مرحله سوم مورد ارزیابی قرار می‌گیرند.