Research Projects
المشاريع البحثية
Innovating at the Intersection of Applied Linguistics and Technology
الابتكار عند تلاقي اللسانيات التطبيقية والتكنولوجيا
My research projects explore the application of computational methods and artificial intelligence to solve complex linguistic problems. From developing AI-powered lexicography tools to building specialized corpora for discourse analysis, each project aims to advance our understanding of language while creating practical resources for researchers, educators, and language learners.
تستكشف مشاريعي البحثية تطبيق الأساليب الحسابية والذكاء الاصطناعي لحل المشكلات اللغوية المعقدة. من تطوير أدوات المعجميات المدعومة بالذكاء الاصطناعي إلى بناء مدونات نصية متخصصة لتحليل الخطاب، يهدف كل مشروع إلى تعزيز فهمنا للغة مع إنشاء موارد عملية للباحثين والمعلمين ومتعلمي اللغة.
Below you'll find detailed information about my featured projects, along with a comprehensive list of all ongoing and completed research initiatives.
ستجد أدناه معلومات مفصلة عن مشاريعي البارزة، إلى جانب قائمة شاملة بجميع المبادرات البحثية الجارية والمكتملة.
Featured Projects
المشاريع البارزة
AMTA: AI-Model Triangulation Approach for Bilingual Dictionary Compilation
AMTA: نهج تثليث النماذج الذكية لصناعة المعاجم ثنائية اللغة
An innovative framework integrating multiple AI models to enhance lexicographic accuracy and efficiency
إطار عمل مبتكر يدمج نماذج ذكاء اصطناعي متعددة لتعزيز دقة وكفاءة العمل المعجمي
Active Development تطوير نشطThis study introduces and empirically validates the AI-augmented Method of Triangulation Approach (AMTA), a novel framework designed to advance specialized bilingual lexicography by systematically integrating corpus linguistics, artificial intelligence, and expert validation. The methodology operationalizes a tripartite process comprising: (1) corpus-driven term selection using log-likelihood (G2) keyness calculations against the British Academic Written English (BAWE) corpus; (2) AI-augmented content generation via a Retrieval-Augmented Cascade Architecture that prioritizes retrieval-augmented generation (RAG) and schema-enforced validation (JSON middleware) to mitigate hallucinatory risks, enhanced by retrieval-augmented generation (RAG); and (3) a multi-dimensional validation layer incorporating quantitative metrics and expert review. Implemented on a scalable Google Apps Script platform that leverages FREE-tier APIs, the framework compiled an English-Arabic dictionary of artificial intelligence terminology in education.
يطور مشروع AMTA إطار عمل جديدًا يستفيد من نماذج ذكاء اصطناعي متعددة (Gemini) لتثليث والتحقق من البيانات اللغوية لتجميع القواميس ثنائية اللغة. من خلال مقارنة مخرجات النماذج المختلفة، يقلل النهج من الأخطاء والتحيزات الكامنة في أنظمة النموذج الواحد، مما يؤدي إلى إنشاء مداخل قاموس أكثر موثوقية وفروق دقيقة. يشمل المشروع تطوير واجهة ويب سهلة الاستخدام وواجهة برمجة التطبيقات للباحثين والمعجميين.
Arabic-English Medical Abstracts Corpus (AEMAC)
مدونة الملخصات الطبية العربية-الإنجليزية
A specialized bilingual corpus for studying academic collocations and translation patterns in medical literature
مدونة نصية ثنائية اللغة متخصصة لدراسة التآلف الأكاديمي وأنماط الترجمة في الأدبيات الطبية
Completed مكتملThis project involved the compilation and annotation of a specialized corpus containing 5,000+ parallel medical abstracts in Arabic and English. The corpus enables quantitative analysis of translation patterns, collocational behavior, and terminological consistency in medical literature. Each text pair is annotated with metadata including publication year, medical specialty, and text type. The corpus has been used in several studies examining cross-linguistic academic discourse and supports research in computational terminology extraction and machine translation for specialized domains.
اشتمل هذا المشروع على تجميع وتدوين مدونة نصية متخصصة تحتوي على أكثر من 5000 ملخص طبي متوازي بالعربية والإنجليزية. تمكن المدونة النصية من التحليل الكمي لأنماط الترجمة، وسلوك التآلف، واتساق المصطلحات في الأدبيات الطبية. يتم تدوين كل زوج نصي ببيانات وصفية تشمل سنة النشر والتخصص الطبي ونوع النص. تم استخدام المدونة النصية في عدة دراسات تفحص الخطاب الأكاديمي عبر اللغات وتدعم البحث في استخراج المصطلحات الحاسوبي والترجمة الآلية للمجالات المتخصصة.
Other Research Projects
مشاريع بحثية أخرى
RLT: Repository-Level Translation Framework
إطار عمل الترجمة على مستوى المستودع (RLT)
AI-assisted translation focusing on long-distance contextual consistency
مساعدة الترجمة المدعومة بالذكاء الاصطناعي مع التركيز على الاتساق السياقي طويل المدى
This project adapts context management principles from code completion to translation. It uses open-source Large Language Models (LLMs) like Gemma to ensure document-wide consistency (terminology, tone, style) by treating key terms as 'variables' and employing RAG for long-distance context retrieval, prioritizing data security and ethical AI practices.
يهدف هذا المشروع إلى تكييف مبادئ إدارة السياق من أدوات إكمال الكود لخدمة الترجمة. ويستخدم نماذج لغوية كبيرة مفتوحة المصدر (مثل Gemma) لضمان اتساق الوثيقة بأكملها (المصطلحات، النبرة، الأسلوب) عن طريق التعامل مع المصطلحات الرئيسية كـ 'متغيرات' واستخدام تقنية RAG لاسترجاع السياق طويل المدى، مع إعطاء الأولوية لأخلاقيات الذكاء الاصطناعي وأمن البيانات.
Sentiment Analysis Toolkit for Arabic Text
أدوات تحليل المشاعر للنص العربي
Developing specialized sentiment analysis models for Arabic social media and news texts
تطوير نماذج تحليل مشاعر متخصصة لنصوص وسائل التواصل الاجتماعي والأخبار العربية
A Python toolkit with pre-trained models for sentiment analysis of Modern Standard Arabic and dialectal texts, featuring specialized models for different domains.
مجموعة أدوات Python بنماذج مدربة مسبقًا لتحليل مشاعر النصوص العربية الفصحى واللهجية، مع نماذج متخصصة لمجالات مختلفة.
View Details → ← عرض التفاصيلDiscourse Analysis of Peace Negotiations
تحليل خطاب مفاوضات السلام
Corpus-based study of linguistic patterns in international peace negotiations
دراسة قائمة على المدونات النصية للأنماط اللغوية في مفاوضات السلام الدولية
Quantitative and qualitative analysis of negotiation transcripts to identify linguistic markers of compromise, confrontation, and resolution in peace dialogues.
تحليل كمي ونوعي لنصوص المفاوضات لتحديد المؤشرات اللغوية للتنازل والمواجهة والحل في حوارات السلام.
View Publication → ← عرض المنشورAI-Powered Language Learning Assistant
مساعد تعلم اللغة المدعوم بالذكاء الاصطناعي
Developing conversational AI tools for English language learners
تطوير أدوات ذكاء اصطناعي محادثة لمتعلمي اللغة الإنجليزية
A chatbot-based learning tool that provides personalized feedback on grammar, vocabulary, and pronunciation for English language learners.
أداة تعلم قائمة على الدردشة توفر ملاحظات مخصصة حول القواعد والمفردات والنطق لمتعلمي اللغة الإنجليزية.
Learn More → ← معرفة المزيدInterested in Collaboration?
مهتم بالتعاون؟
I'm always open to collaborating on innovative research projects at the intersection of linguistics, computational methods, and artificial intelligence. Whether you're a researcher, student, or industry professional working on related topics, I'd be happy to discuss potential collaborations.
أنا دائمًا منفتح على التعاون في مشاريع بحثية مبتكرة عند تقاطع اللسانيات والأساليب الحسابية والذكاء الاصطناعي. سواء كنت باحثًا أو طالبًا أو محترفًا في الصناعة تعمل على مواضيع ذات صلة، سأكون سعيدًا بمناقشة التعاون المحتمل.
Get in Touch تواصل معي