دوستان سلام
تصمیم گرفتم قسمتی از چکیده پایان نامه ام رو روی وبلاگ قرار بدم تا دوستانی که علاقمند هستند نظراتشون رو به اشتراک بذارن.
تشخیص نویسندهی یک متن با استفاده از روشهای آماری در حوزهی شناسایی نویسنده که یکی از مسائل مهم در پردازش زبان طبیعی است قرار میگیرد. در مسئلهی شناسایی نویسنده با استفاده از روشهای آماری عمل انتساب متنی بینام به نویسندهای صورت میگیرد. از مسائل مهم در این حوزه انتخاب ویژگیهای سبکی متن برای مطالعهی آماری آن است. برای این کار لازم است ویژگیهایی انتخاب شود که بتوان بهصورت کمّی آنها را مورد مطالعه قرار داد. این ویژگیها میتوانند واژگانی، حرفی، نحوی و یا مفهومی باشند. در مرحلهی دستهبندی متن که پس از انتخاب و استخراج ویژگیها و به منظور شناسایی نویسندهی متن صورت میگیرد، از روشهای مختلفی همچون درخت تصمیم، شبکهی عصبی مصنوعی، بیز ساده و روشهای دیگر دستهبندی میتوان استفاده کرد.
در این پژوهش، هدف اصلی تعیین کارآمدترین ویژگیهای سبکی در متون فارسی و کمّی سازی آنها برای استفاده در سامانههای شناسایی نویسنده است. به این منظور، به بررسی ویژگیهای سبکی آثار چهار شاعر شعر نو (مهدی اخوان ثالث، نیما یوشیج، احمد شاملو و سهراب سپهری) در سه سطح واژگانی، نحوی و حرفی از پیکرهای که متشکل از اشعار این چهار تن بود پرداختیم. در مرحلهی بعد، با استفاده از سه دستهبند K نزدیکترین همسایه، ماشین بردار پشتیبان و بیز ساده عمل دستهبندی و انتساب دادههای آزمایش به یکی از چهار شاعر فوق را انجام دادیم.