پیدا کردن عبارات منفی ومثبت در پست ها و کامنت های توییتر
در این مطالعه، ما از روش گروهی برای تشخیص گفتار نفرت به زبان اندونزیایی استفاده کردیم. ما ازالگوریتم طبقه بندی مستقل ماشین های بردار پشتیبانی در مجموعه داده های گفتار نفرت توئیتر استفاده کردیم.
پیش پردازش توییت
در پیش پردازش توییت ، مراحلی وجود دارد که باید انجام شود:
1.)جداسازی
2)فیلتر کردن
۳)ریشهکن کردن
۴)وزن دهی عبارت
توکن سازی تقسیم توییت ها به واحدهای کوچکتر به نام توکن یا اصطلاحات است.
در این فرآیند، تاکردن و تمیز کردن نیز انجام می شود تصویر که در پروژه میبنینی در حقیقت همان وزن دهی به عبارت ها ویا ایجاد توکن های اختصاصی برای جملات است ما بواسطه این توکن ها میتوانیم میزان ارزش منفی یا مثبت یک عبارت را درک کنیم ودر ادامه به این توییت برچسب مثبت یا منفی بواسطه میزان عبارات استفاده شده براساس مجموع وزن ها دهیم.
این پروژه یک پروژه کامل ومناسب وسطح بالا برای دوره کارشناسی و همچنین ارشد برای گرایش های مختلف میباشد. در صورت کمی ادامه دادن کد میتواند یک موضوع پایان نامه کامل نیز باشد.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.