دانلود پایان نامه استفاده از اینترنت و انتخاب نمونه

دانلود پایان نامه

در این تحقیق از مطالعات کتابخانه‌ای به طور گسترده‌ای استفاده شده است که این مطالعات شامل بررسی تحقیقات موجود و مرتبط با موضوع، مطالعه مقالات و کتب لاتین و فارسی مرتبط و همچنین استفاده از اینترنت و خصوصاً وب‌سایت کاوش ایده می‌باشد.
3-5 جامعه آماری
در صدر برنامه ریزی هر مطالعه یا تحقیقی این سوال که حجم نمونه چقدر باید باشد قرار دارد. انتخاب نمونه بزرگ‌تر از حد نیاز موجب اتلاف منابع می‌شود و انتخاب نمونه‌های خیلی کوچک منتج به نتایج غیرقابل اتکا می‌شود[6]. نمونه آماری عبارت است از تعدادی از افراد جامعه که صفات آن‌ها با صفات جامعه مشابه بوده معرف جامعه باشد. نمونه گیری نیز فرایند انتخاب نمونه است. در این تحقیق، مطالعه بر روی متن‌های مختلف که شامل توضیح مسأله و راه‌حل‌های آن می‌باشد انجام می‌گیرد .
3-5 روش‌های تجزیه و تحلیل اطلاعات
در این تحقیق، برای تجزیه و تحلیل متن‌ها، از نرم افزار C#.NET استفاده شده است. سی‌شارپ (C#) زبانی شیءگرا و سطح بالا (high level) از خانوادهٔ زبان‌های چارچوب دات‌نت شرکت مایکروسافت است.
زبان #C، یک زبان برنامه نویسی چند الگویی است و منظم شده مدل‌های تابعی، امری، عمومی، شی گرا و جز گرا می‌باشد. این زبان توسط ماکروسافت و جزئی از دات نت به وجود آمد و بعداً استانداردهای ECMAو ISO را نیز در بر گرفت. #C یکی از ۴۴ زبان برنامه نویسی ای است که توسط زمان اجرای زبان مشترک از .NET Framework پشتیبانی می‌شوند و در همه جا به وسیله مایکروسافت ویژوال استودیو شناخته می‌شود.
این زبان برپایه سادگی، مدرن بودن، همه منظوره و شی گرا بودن ساخته شد.آندرس هلسبرگ ، طراح زبان برنامه نویسی دلفی، سرپرستی تیم طراحان زبان #C را بر عهده داشت.این زبان دارای دستوری شی گرا مشابه ++C است و به شدت از زبان‌های جاوا و دلفی نیازمندمدرک تاثیر پذیرفته‌است. در ابتدا نام این زبان COOL بود که مخفف C like Object Oriented Language بود، هر چند در جولای ۲۰۰۰، زمانی که ماکروسافت پروژه را عمومی اعلام کرد، اسم آن به #C تغییر پیدا کرد.آخرین نسخه آن نسخه ۵.۰ است که همزمان با دات‌نت ۴.۵ در آگوست ۲۰۱۲ منتشر شد.
C# زبانی قوی و در عین حال انعطاف‌پذیر است و می‌تواند همانند سایر زبان‌های برنامه‌نویسی برای تولید انواع برنامه‌های کاربردی بکار رود. این زبان برای ایجاد واژه پردازها، برنامه‌های گرافیکی، صفحات گسترده و حتی کامپایلرهای زبان‌های دیگر بکار می‌رود. دلایل دیگر محبوبیت C#ویژگی‌هایی است که قبل از این ذکر کردیم: سادگی، شیء گرا بودن، ماجولار بودن و انعطاف‌پذیری،پلی مورفیسم، کپسوله‌سازی و ……
با توجه به توابع موجود در .NETامکان استفاده از این توابع وجود دارد که می توان گفت برای هر کاری شرکت ماکروسافت تابعی پیش بینی کرده است. که این امکان را ایجاد میکند که به فایل اصلی پروژه هیچ فایل کتابخانهای را اضافه نکنید(هم به صورت دستی یا خود کمپایلر) . این موضوع خود باعث ایجاد فایل های خروجی با حجم بسیار کم می شود . این موضوع در بسیاری از موارد بسیار اهمیت دارد. برنامه‌های سی شارپ، همچون تمام برنامه‌های نوشته شده در .NET و سایر محیط‌های ماشینی مجازی مانند جاوا، نیازمند منابع سیستم و حافظه بیشتری نسبت به برنامه‌های نوشته شده با سایر زبان‌ها مانند سی پلاس پلاس است و هم چنین سرعت کمتری نیز دارد. هر چند تعریف زبان #C و CLI تحت استانداردهای ISO و ECMA استاندارد شده‌اند،CLI تنها قسمتی از BCLمایکروسافت می‌باشد که شامل کلاس‌های غیر استاندارد استفاده شده در برنامه‌های #C نیز می‌شود.از این گذشته، بعضی از قسمت‌های BCL تحت حق امتیاز مایکروسافت هستند که ممکن است پیاده سازی کامل چارچوب را مختل کند، زیرا تنها بخش‌های استاندارد دارای حق محافظت RAND در برابر مدعیان را دارند.
فصل چهارم: رهیافت جدید پیشنهادی
4-1 مقدمه
در این فصل ابتدا روش کاوش ایده و نحوه عمل آن در متن‌های فارسی شرح داده می‌شود و سپس کاربرد آن را در فرایند مهندسی دانش بیان می‌کنیم.
روش کاوش ایده از معیارهای مختلفی استفاده می‌کند و برای این معیارها پارامترهای مختلفی به کار می‌برد. اکثر این پارامترها به صورت ابتکاری و با کمک خبره‌ها در زمینه‌های مختلف به دست آمده است که مقدار این پارامترها بر اساس میزان مفید بودن مقادیر مختلف در موارد مختلف بدست آمده است. در ادامه تمام معیارها و پارامترها و مقادیر انتسابی به آن‌ها بیان می‌شود.
4-2 روش کاوش ایده به زبان فارسی
در این بخش مراحل روش کاوش ایده و نحوه انجام مراحل مختلف آن روی متن‌های فارسی شرح داده می‌شود.
در روش کاوش ایده، از طول ثابت، برای الگو استفاده نمی‌شود بلکه از طول متغیر الگوهای متنی بر اساس وفق دهی پویا با متنش استفاده می‌شود.
در این روش از شمای توزین اصطلاحات بر اساس تفاوت بین کلمه‌های عمومی و کلمه‌های غیر عمومی و با توجه به اینکه اهمیت کلمات عمومی به اندازه اهمیت کلمه‌های غیر عمومی بالا نیست استفاده می‌شود. اگر نویسنده ایده را بسیار خلاصه به وسیله پیوستن کلمه‌های اصلی به هم فرموله کند پس به صورت نرمال از بسیاری از کلمه‌های عمومی استفاده نمی‌کند و طول الگوی متن می‌تواند کوچک باشد. اگر نویسنده متن را با سبک گل و بلبل فرموله کند به این معنی که نوشته‌اش را با روش واضح و ساده بیان نکند پس او به صورت نرمال از کلمه‌های عمومی زیادی استفاده می‌کند و الگوی متنی باید بزرگ‌تر باشد. در روش کاوش ایده مقدار طول الگوی متن L و u درصد اهمیت کلمه‌ی عمومی و v درصد اهمیت کلمه‌های غیر عمومی می‌تواند به وسیله کاربر اعمال شود.
برای محاسبه تغییر طول الگوی متن باید اول شمای توزین اصطلاح را تعریف کنیم.
تعریف 1: I=[wI …, wn] یک لیست از اصطلاحات (کلمات) wi در ترتیب ذکر شده و nتعداد اصطلاحات در T است و I ، E= [] یک مجموعه ازاصطلاحات در است. درصد U ضریب وزن اصطلاح برای کلمه عمومی است. درصد V ضریب وزن اصطلاح برای کلمه غیرعمومی است. پس ما Fg(w i) را به عنوان شمای وزن اصطلاحات تعریف می‌کنیم.
F g(w i)=
ما یک مثال برای این ارائه می‌دهیم. الگوی متن:
موبایل برای انتقال داده از مادون قرمز
در اطراف کلمه داده ساخته شده است. که این شامل خود کلمه‌ی داده و چهار کلمه از متن قبل از آن، و چهار کلمه از متن بعد از آن است.
اینجا، ما از طول ثابت 4=L استفاده کرده‌ایم و شمای وزنی اصطلاح با %100 = =. این به این معنی است که اهمیت کلمه عمومی و غیرعمومی با هم برابر است. الگوی متن بعدی مثال طول متغیر است.
“که در اولین فاز موجود در آن که از مواد و تکنولوژی‌هایی مانند سیستم‌های لایه‌ای و کریستال‌ها”
این الگوی متن در اطراف کلمه “تکنولوژی‌هایی” ساخته شده است. اینجا ما از طول ثابت L=3 استفاده کردیم و شمای وزنی اصطلاح با U=10X و V=100Y استفاده کردیم. به عنوان نتیجه این الگوی متن شامل 6 اصطلاح برای متن راست و 11 اصطلاح برای متن چپ اصطلاح “تکنولوژی‌هایی” است. در این مثال، کلمه‌های غیر عمومی، فاز، مواد، تکنولوژی، سیستم، لایه و کریستال هستند که تعداد اصطلاحات را از متن چپ و راست به صورت زیر محاسبه کردیم.