تصوير وصفة طبية بالهاتف ثم الحصول بعد عشر ثوانٍ على قائمة منظمة بالأدوية والجرعات والمدة والتكرار: هذه هي التجربة التي تقدمها DossiMed للمستخدم. خلف هذه البساطة الظاهرة توجد بنية تقنية تجمع بين جيلين من الذكاء الاصطناعي، وانضباط قوي في الخصوصية، وحد واضح فيما يخص المسؤولية الطبية. هذا المقال يشرح منطق نهجنا دون كشف تفاصيل داخلية حول الـ prompts أو إعدادات النماذج.

تحدي الوصفة اليدوية

إذا جربت استخدام OCR عام على وصفة طبية، فأنت تعرف النتيجة: نص مشوش فيه مقاطع تبدو مقروءة لكنها غير موثوقة. الأسباب تتراكم:

  • خط سريع وغير موحد - الكتابة الطبية غالبا متصلة ومائلة ومضغوطة
  • اختصارات مهنية - مثل Dsp و mane و nocte و cp و amp خارج القواميس العامة
  • تنسيقات غير متجانسة - رأس الوثيقة والنص الطبي والتوقيع والختم والملاحظات القانونية بدون شبكة ثابتة
  • لغات مختلطة - رأس بالعربية، متن بالفرنسية، وأسماء لاتينية في نفس الوثيقة
  • جودة صورة ضعيفة - إضاءة غير مناسبة، تصوير سريع، ورقة مجعدة أو جزء مخفي

بالنسبة لـ OCR عام، كل عامل من هذه العوامل يخفض الدقة. ومعا تصبح النتيجة غير قابلة للاعتماد.

أخطر نتيجة في OCR الطبي الضعيف ليست النص غير المقروء، بل الخطأ الصامت. جرعة مقروءة بشكل خاطئ قد تبدو منطقية رغم أنها غير صحيحة. في الصحة، هذا يفرض مقاربة مختلفة جذريا عن OCR التقليدي.

خط أنابيب من طبقتين

نهجنا مبني على طبقتين متتاليتين، كل واحدة متخصصة في مهمة تتعامل معها نماذج الذكاء الاصطناعي الحالية بكفاءة عندما تُفصل عن الأخرى.

الطبقة 1 - الاستخراج البصري

الطبقة الأولى تعتمد على خدمة حديثة من Document Intelligence. هذا النوع من الخدمات مدرب على وثائق منظمة (فواتير، عقود، نماذج طبية) ويقرأ الحروف والبنية معا. ويخرج نتيجتين:

  • نص خام يعيد تسلسل كلمات الوثيقة
  • تمثيل جدولي يتعرف الصفوف والأعمدة عند وجودها (مثلا في التحاليل)

في هذه المرحلة نكون قد حولنا الصورة إلى نص. لكن النص يبقى مشوشا وملتبسا وغير منظم دلاليا.

الطبقة 2 - الاستخراج الدلالي

الطبقة الثانية تستخدم نموذجا لغويا توليديا من فئة frontier مهيأ لإخراج JSON منظم انطلاقا من النص الخام. ودوره ثلاثي:

  1. استخراج الكيانات الطبية - أسماء الأدوية، الجرعات، التكرار، المدة، تعليمات الاستعمال، اسم الطبيب، التخصص، تاريخ الإصدار، ومكان الممارسة
  2. تصنيف نوع الوثيقة - الوصفة الدوائية، تقرير التحليل، أو التصوير الطبي لكل منها بنية مختلفة؛ التصنيف يوجه المعالجة اللاحقة
  3. تصحيح أسماء الأدوية المكتوبة خطأ - OCR يخرج Glecnvanc 50 mg؛ النموذج يقترح Glivec 50 mg مع درجة ثقة، ويمكنه تشغيل تحقق دوائي للحالات الملتبسة

النتيجة هي JSON نظيف جاهز للاستخدام داخل التطبيق: قائمة الأدوية بمعاملاتها، بيانات الوثيقة، مؤشرات الثقة، وتنبيهات محتملة.

خط أنابيب OCR + الذكاء الاصطناعي الوثائقي: استخراج بصري، استخراج دلالي، تحقق المستخدم

انضباط الخصوصية

خط أنابيب ذكاء وثائقي في الصحة يطرح سؤالا مباشرا: ما الذي نرسله إلى نموذج الذكاء الاصطناعي؟ التنظيم الأوروبي، والمنطق المهني، يفرضان الحد الأدنى الممكن.

لا يتم إرسال أي بيانات تعريفية للمريض إلى النموذج. الاسم، تاريخ الميلاد، رقم الضمان الاجتماعي، الحساسية، الأمراض المزمنة السابقة - لا شيء من ذلك يغادر حدود خادم الذكاء الاصطناعي. النموذج يستقبل فقط نص الوثيقة ليحوّله إلى بنية منظمة.

هذا المبدأ له أثران عمليان:

  • تقليل مخاطر التسرب - حتى في حال وقوع حادث لدى مزود خارجي، لن تنكشف هوية المرضى
  • تبسيط الامتثال لـ GDPR - لا يتم إرسال بيانات فئة خاصة وفق المادة 9 خارج المحيط الأوروبي الموسع

والجانب السلبي يجب ذكره بوضوح: النموذج لا يمكنه الاستناد دائما إلى سياق المريض لحل كل الغموض. عندها تُعلَّم السطور على أنها تحتاج مراجعة المستخدم ويُطلب تأكيد يدوي.

تعدد اللغات في الذكاء الاصطناعي الوثائقي

الخط يجب أن يعالج وصفات بالفرنسية أو العربية أو الإنجليزية، وغالبا بمزيج لغوي داخل نفس الوثيقة (رأس بالعربية، متن بالفرنسية، توقيع باللاتينية). هذا شائع في المغرب العربي والشرق الأوسط لكنه ما زال تحديا تقنيا يُستهان به.

العربية تحديدا أكثر تعقيدا: طبيعتها المتصلة تصعب OCR، واتجاه الكتابة من اليمين إلى اليسار قد يولد شوائب في التسلسل النصي إن لم يكن الإعداد صحيحا.

خيارنا: عدم فرض لغة الوثيقة مسبقا. الخط يكتشف اللغة المهيمنة تلقائيا انطلاقا من المحارف والمفردات، ثم يكيّف المعالجة اللاحقة. بالنسبة للمستخدم، هذا يعني أنه يصور الوصفة كما هي دون اختيار لغة.

التحقق البشري كحلقة أخيرة

قرار تصميمي أساسي يميز DossiMed عن أدوات دعم القرار الطبي: المستخدم يتحقق دائما من ناتج الاستخراج. بعد إنتاج JSON المنظم، يعرض التطبيق الحقول القابلة للتعديل في شاشة التفاصيل. يمكن للمستخدم تصحيح اسم دواء، تعديل جرعة، تغيير التكرار، أو حذف سطر. ما يولد التذكيرات هو ما اعتمده المستخدم، لا ما استنتجه الذكاء الاصطناعي.

هذا ليس قرار UX فقط، بل قرار تنظيمي. طالما أن DossiMed لا يتخذ أي قرار طبي ذاتي - لا اقتراح جرعة، لا تنبيه تداخل دوائي، لا تفسير نتائج تحليل - فإنه يبقى تحت عتبة تصنيف البرمجيات كجهاز طبي وفق MDR 2017/745. الذكاء الاصطناعي يقترح، المستخدم يقرر، والطبيب يظل المسؤول.

إدارة حالات الخطأ

لا يوجد خط أنابيب ذكاء اصطناعي مثالي. خطنا يتعامل مع حالات الخطأ بشكل صريح وشفاف.

انخفاض ثقة OCR - صورة ضبابية، وثيقة مخفية جزئيا، إضاءة ضعيفة. يتم تعيين الحالة إلى needs_review بدلا من استخراج غير موثوق. التطبيق يطلب إعادة التصوير أو التصحيح اليدوي.

عدم يقين النموذج اللغوي - عندما يصرح LLM بعدم اليقين حول دواء أو جرعة، يظهر الحقل بمؤشر بصري واضح. يعرف المستخدم ضرورة المراجعة قبل توليد خطة التذكير.

وثيقة غير طبية - مرشح مبدئي يتحقق من غياب مؤشرات طبية متوقعة (ordonnance، posologie، analyse، laboratoire، إلخ) ويرفض الوثيقة بأدب قبل المعالجة المكلفة. هذا يحمي جودة التجربة وتكلفة التشغيل معا.

ما الذي يضمنه هذا الخط

  • عدم إرسال أي secret أو بيانات تعريفية إلى نموذج AI خارجي
  • التحقق الإلزامي من المستخدم قبل توليد أي تذكير
  • حالة needs_review واضحة عند انخفاض الثقة
  • رفض مبكر للوثائق غير الطبية لضبط التكاليف
  • قابلية النقل: طبقة الاستخراج يمكن استبدالها بأي مزود منافس

منصة قابلة للحمل

الخط الكامل - الاستخراج البصري، الاستخراج الدلالي، التحقق، والدمج في قاعدة منظمة - منفذ عبر عدد محدود من serverless edge functions. وهو قابل للنقل بين مزودي الذكاء الاصطناعي: الطبقة البصرية يمكن استبدالها بخدمة Document Intelligence منافسة، والطبقة الدلالية بأي نموذج frontier قادر على إنتاج JSON منظم، سواء كان مدارا سحابيا أو مستضافا ذاتيا.

هذه القابلية للنقل قيمة جدا لمؤسسة تريد نشر DossiMed في سحابة سيادية أو ربطه بـ LLM داخلي. كود التطبيق لا يفترض أي اعتماد لا رجعة فيه على مزود بعينه.

بالنسبة للمريض، النتيجة تطبيق يحول صورة وصفة مجعدة إلى ملف طبي منظم، مقروء وقابل للمشاركة مع الطبيب. وبالنسبة للجهات التي قد تتبناه، فهي منصة يمكن توصيل محرك الذكاء الوثائقي فيها بالبنية التي تختارها.


DossiMed تصدرها REC، وهي شركة تونسية موجهة بالكامل للتصدير. للاستفسارات التجارية أو الشراكات الاستراتيجية: contact@dossimed.ai.