این اسلاید مربوط به کارگاه «تکنیکها و چالشهای جستجو در متون فارسی» است
نوع فایل: pptx
تعداد صفحات: 44 صفحه
فهرست مطالب اسلاید در این کارگاه:
Oبخش اول
- Oمقدمهای در جستجو و بازیابی اطلاعات
- Oآشنایی با مفاهیم نمایهسازی متن
Oبخش دوم
- Oآشنایی با کتابخانههای جستجوی تماممتن
- Oیک مثال کاربردی
- Oفشردهای از تکنیکهای نمایهسازی در زبان انگلیسی
Oبخش سوم
- Oمسائل خاص زبان فارسی: اعراب، نویسههای مشابه، وندهای تصریفی و اشتقاقی، افعال
- Oپیادهسازی گام به گام یک مؤلفهی جستجوی خاص زبان فارسی
- Oمقدمهای در جستجو و بازیابی اطلاعات
- Oجستجو ! نیاز به نمایهسازی (چرا؟)
برخی از سرفصل های داخلی پاورپوینت:
جستجو: انسان در برابر کامپیوتر
جستجو در کامپیوتر
مقایسهی زوجی در کامپیوتر
کدینگ در عربی
جستجوی خطی و دودویی
Oعلوم کامپیوتر
Oشناخت و پیادهسازی الگوریتمها)
Oهوش مصنوعی
Oروشهای جستجو
Oمتنکاوی
Oجستجوی بهینه: روشهای خوشهبندی، برچسب زنی و ...
Oزبانشناسی
Oاستخراج قواعد رسمی یک زبان
مفاهیم جستجوی تماممتن
Oجستجوی فرادادهای
نمایهی معکوس
مستند
فعالیت عملی:Oپیادهسازی یک جستجوگر ساده با استفاده از موتور جستجوی سولر
Oلزوم استفاده از کدینگ استاندارد، مثلاً UTF-8 که توسط سولر پشتیبانی میشود.
مؤلفههای مورد نیاز زبان فارسی
Oتکهتکه سازی (Tokenization)
Oعلاوه بر موارد مربوط به زبان انگلیسی
Oنرمالسازی (Normalization)
Oریشهیابی (Stemming / Lemmatization)
اسلاید تکنیکها و چالشهای جستجو در متون فارسی pptx