قصدك الطريقة اليدوية؟ أنا قصدي كان طريقة تقسيم الcorpus لعدة corpora بناء على الclasses الموجودين
لكن المشكلة هنا حجم الcorpus، أنا بالكاد جمعت 1775 عينة لكلاس واحد فقط (جمعت 15000 عينة بالواقع لكن بعد الفحص اكتشفت فقط 1775 ينتمون لهذا الكلاس… ولسه راح أعطي البيانات لمختص نفسي حتى يقيمها)
لكن المشكلة هنا حجم الcorpus، أنا بالكاد جمعت 1775 عينة لكلاس واحد فقط (جمعت 15000 عينة بالواقع لكن بعد الفحص اكتشفت فقط 1775 ينتمون لهذا الكلاس… ولسه راح أعطي البيانات لمختص نفسي حتى يقيمها)
مافي احد متخصص NLP ماسواها... تقدر تستخدم مكتبات جاهزة زي wordnet او تبني كربس خاص فيك مع انك لازم تحقنه. طبعا استخدمتها على اللغة الانجليزية.