في إطار التوجيهات الاستراتيجية لخطة العمل الصينية الثلاثية لـ «عناصر البيانات ×» و«AI+» — وهي مبادرة خاصة مخصصة للشركات المملوكة للدولة على المستوى المركزي — تشهد صناعة النفط والغاز تحولًا رقميًّا وذكائيًّا عميقًا. وعلى وجه الخصوص، فإن «مبادرة نبض البيانات» المقترحة في خطة عمل «AI+» الخاصة بشركة CNOOC قد رفعت تطوير مجموعات البيانات عالية الجودة والجاهزة للاستخدام في النماذج إلى أولوية استراتيجية لم يسبق لها مثيل. وبمقارنة ذلك بالممارسات الدولية المتقدمة، مثل مجموعة البيانات العامة Penobscot ونظام DDMS القائم على OSDU التابع لشركة ExxonMobil، فإننا ندرك بوضوح أن سد الفجوة بين «البيانات الأولية» و«البيانات الجاهزة للنماذج» قد أصبح الأساس الحاسم لتفعيل عناصر البيانات ودفع عجلة التنمية عالية الجودة في هذه الصناعة.
ومع ذلك، لا تزال أعمال النفط والغاز في مرحلة الاستكشاف والإنتاج تواجه تحديات كبيرة في مجال التطبيق المتعمق للبيانات، مما يحد بشكل كبير من عمق ونطاق اعتماد الذكاء الاصطناعي. تهدف هذه الورقة البيضاء إلى اقتراح نموذج تشغيلي جديد قائم على البيانات لعمليات الاستكشاف والتطوير، مدعومًا بمنصة من الجيل التالي تدمج النهج القائمة على المعرفة مع الآليات الفيزيائية. ويتمثل هدفها الأساسي في معالجة العقبات التي تعترض تحقيق قيمة البيانات بشكل منهجي، وتمكين خبراء الأعمال في الخطوط الأمامية.
ولتحقيق هذه الرؤية، يتعين علينا أولاً مواجهة التحديات الأربعة الأساسية التي تواجهها صناعة النفط والغاز حالياً في مجال إنشاء قواعد بيانات عالية الجودة:
1. عدم التوافق بين الأسس البياناتية واحتياجات الأعمال. غالبًا ما تكون عمليات تنقية البيانات التقليدية التي تعتمد على تكنولوجيا المعلومات منفصلة عن الممارسات التجارية بسبب الافتقار إلى الفهم العميق للآليات المادية في مجال النفط والغاز. على سبيل المثال، عند معالجة بيانات تسجيل الآبار أو بيانات الإنتاج، قد تحتوي بعض «القيم المتطرفة» المحددة إحصائيًا في الواقع على معلومات جيولوجية بالغة الأهمية، مثل مناطق الضغط العالي أو أحزمة التصدع. وقد تؤدي قواعد التنقية التي لا تراعي قيود الآليات الفيزيائية إلى التعرف الخاطئ على هذه الإشارات الرئيسية وإزالتها بسهولة، مما يؤدي إلى تشويه البيانات. بالإضافة إلى ذلك، فإن عدم اتساق معايير نماذج البيانات وعدم كفاية عمليات التحقق من صحة البيانات على نطاق واسع تجعل من الصعب على قاعدة البيانات أن تدعم بشكل فعال تدريب وتطبيق نماذج عالية الجودة.
2. العقبات التي تعترض عملية تعليق البيانات عالية الجودة. يعتمد العمل الحالي في مجال تعليق البيانات اعتمادًا كبيرًا على العمليات اليدوية التي يقوم بها خبراء المجال، مما يؤدي إلى ظهور أربعة معوقات رئيسية. أولًا، الكفاءة منخفضة ولا يمكنها تلبية الطلب على العينات التدريبية الضخمة التي يتطلبها تدريب النماذج على نطاق واسع. ثانيًا، التكاليف مرتفعة، نظرًا لندرة موارد الخبراء وقيمتها العالية. ثالثًا، الجودة غير مستقرة، حيث قد يطبق الخبراء المختلفون معايير وتفسيرات مختلفة للتعليق. رابعًا، يؤدي الافتقار إلى نموذج دلالي موحد إلى عدم اتساق معايير التعليق، مما يجعل من الصعب إعادة استخدام البيانات وتجميعها. وقد أصبح هذا عائقًا حاسمًا أمام التنفيذ العملي لتطبيقات الذكاء الاصطناعي.
3. عمليات البناء وأنظمة الإدارة غير المكتملة. لم تقم الصناعة بعد بوضع نظام شامل لإدارة دورة الحياة الكاملة للبيانات على نطاق واسع، يشمل جمع البيانات، وإدارتها، ووضع التعليقات التوضيحية عليها، والتحقق من صحتها، وتحديثها، وتطبيقها. ونتيجة لذلك، تفتقر العديد من مجموعات البيانات المُنشأة إلى آليات فعالة لإدارة الإصدارات، وتتبع أصل البيانات، والتعاون. وغالبًا ما تقع هذه المجموعات في معضلة «إنشائها مرة واحدة مع صعوبة إعادة استخدامها»، مما يجعل من المستحيل تكوين قدرة مستقرة وفعالة ومستدامة لتوفير البيانات الذكية.
4. صعوبة في الإفصاح عن قيمة البيانات. يمتلك الجيولوجيون ومهندسو الخزانات العاملون في الخطوط الأمامية في صناعة النفط والغاز ثراءً هائلاً من المعرفة التجارية، لكنهم يفتقرون عمومًا إلى القدرات المهنية في مجال برمجة الخوارزميات وتطوير النماذج. وفي مواجهة أصول ضخمة من «بحيرات البيانات»، فإنهم في حاجة ماسة إلى حل مشكلات الإنتاج الفعلية، إلا أنهم غالبًا ما يفتقرون إلى أدوات النمذجة الجاهزة للاستخدام التي تعتمد على «البرمجة المحدودة» أو «البرمجة بدون كود». ونتيجة لذلك، لا يمكن الاستفادة من قيمة أصول البيانات بشكل كامل وفعال.
لمواجهة التحديات المذكورة أعلاه بشكل منهجي، قامت شركة «جوراسيك سوفتوير» بتصميم بنية منصة جديدة. والهدف من ذلك هو جعل سير العمل المعقد المتعلق بإعداد البيانات والنمذجة أكثر توجهاً نحو العمليات، وأكثر ذكاءً، وأسهل في الوصول إليه، مما يدعم نموذج التشغيل الجديد هذا.
وللتصدي بفعالية للتحديات المذكورة أعلاه، تتمثل فلسفة التصميم الأساسية لهيكل المنصة في «ترحيل البيانات بالإضافة إلى الإدارة الموجهة نحو السوق». ويُجنّب هذا المبدأ المعماري المخاطر والتكاليف الباهظة المرتبطة باستبدال بحيرات البيانات المؤسسية الحالية. وبدلاً من ذلك، فإنه يبني طبقة وسيطة مرنة وذات قيمة عالية. تقوم المنصة بـ«ترحيل» البيانات الأولية بكفاءة من بحيرة البيانات، وتعالجها من خلال سلسلة من سير العمل الذكي للتحسين وهندسة الميزات، وتشكل في النهاية «سوقًا» موثوقًا به وقابلًا للتتبع وقابلًا لإعادة الاستخدام من أصول الميزات عالية الجودة. كما توفر للخبراء في مجال الأعمال بيئة حوسبة ونمذجة متكاملة تعتمد على الكود المحدود، مما يسرع بشكل كبير من وقت طرح تطبيقات الذكاء الاصطناعي في السوق مع ضمان حوكمة البيانات وإمكانية تتبع أصل البيانات.
تتألف البنية المنطقية للمنصة من أربع طبقات، لكل منها مسؤوليات واضحة وهامة:
1. طبقة استيعاب البيانات. باعتبارها نقطة الدخول الاستراتيجية لتوحيد البيانات، تعمل هذه الطبقة على دمج أصول البيانات المؤسسية الحالية بسلاسة. وهي قادرة على الاتصال ببحيرات البيانات وقواعد بيانات الرسوم البيانية المعرفية على مستوى المؤسسة، كما تدعم مهام ترحيل البيانات المجدولة أو التي يتم تشغيلها استجابةً لأحداث معينة، وذلك للبيانات غير المتجانسة من مصادر متعددة، بما في ذلك ملفات LAS الخاصة بتسجيل الآبار، وملفات SEGY الخاصة بالبيانات الزلزالية، والتقارير بصيغة PDF، وتقارير الإنتاج. ويضمن هذا التصميم قدرة المنصة على الحصول باستمرار على أحدث البيانات الأولية مع البقاء منفصلة عن أنظمة تخزين البيانات الأساسية.
2. طبقة معالجة البيانات وهندسة الميزات — Feature Factory. باعتبارها محرك المعالجة الأساسي للمنصة، صُممت هذه الطبقة لتكون بمثابة «مصنع للميزات». وهي تدمج أربع قدرات رئيسية لتحويل البيانات الأولية إلى ميزات عالية الجودة:
(1) محرك تحليل البيانات غير المنظمة: تتيح أدوات التعرف الضوئي على الحروف (OCR) ومعالجة اللغة الطبيعية (NLP) والرؤية الحاسوبية المدمجة الاستخراج الآلي للمعلومات المنظمة من البيانات غير المنظمة، مثل تقارير PDF الممسوحة ضوئيًا والتقارير اليومية والصور الأساسية.
(2) محرك تنقية البيانات القائم على مبادئ الفيزياء: استنادًا إلى مكتبات القواعد التي تم إنشاؤها بناءً على المعرفة المتخصصة في مجالات مثل ميكانيكا الموائع والإحصاء الجيولوجي، يقوم هذا المحرك بتنقية البيانات والتحقق من صحتها وفقًا لقوانين الأعمال والقوانين الفيزيائية.
(3) محرك دمج البيانات متعدد الوسائط: يعالج هذا المحرك التحدي الأساسي المتمثل في مواءمة مستويات التفصيل. فعلى سبيل المثال، يقوم المحرك بمواءمة بيانات الإنتاج ذات مستوى التفصيل الزمني «الأيام» وبيانات تسجيل الآبار ذات مستوى التفصيل العمقي «الأمتار» بطريقة ذكية، مما يؤدي إلى تكوين رؤية تحليلية موحدة.
(4) محرك الترميز القائم على المعرفة: من خلال الاستفادة من الكيانات والعلاقات المتراكمة في مخطط المعرفة المؤسسي، يتيح هذا المحرك إنشاء علامات نموذجية تلقائيًّا، مما يقلل بشكل كبير من تكلفة الترميز اليدوي.
3. طبقة إدارة الميزات — مخزن الميزات. تُعد هذه الطبقة بمثابة «سوق الميزات» للمنصة، وتشكل الأساس لتحويل أصول البيانات إلى ميزة تنافسية أساسية. فهي تقوم بتخزين مجموعات الميزات عالية الجودة التي تنتجها «مصنع الميزات» (Feature Factory) بشكل مركزي، وتوفر قدرات إدارة شاملة. تدعم المنصة التحكم في إصدارات الميزات لضمان قابلية تكرار تدريب النماذج. كما توفر إدارة غنية للبيانات الوصفية وقدرات بحث عن النص الكامل، مما يتيح للمستخدمين اكتشاف أصول الميزات الحالية وفهمها وإعادة استخدامها بسرعة. وبهذه الطريقة، تكسر المنصة حواجز عزل البيانات وتقضي على عمليات إعداد البيانات المتكررة عبر الفرق المختلفة.
4. نمذجة الخوارزميات وطبقة الخدمات — مختبر الذكاء الاصطناعي وتقديم الخدمات. تُعد هذه الطبقة بمثابة الوسيلة التي تتيح إتاحة قدرات الذكاء الاصطناعي على نطاق واسع. فمن خلال لوحة نمذجة مرئية تعتمد على تقنية «البرمجة منخفضة الكود»، تعمل هذه الطبقة على تحويل عمليات نمذجة الخوارزميات المعقدة إلى عمليات بسيطة تعتمد على السحب والإفلات، مما يوسع نطاق قدرات النمذجة من عدد قليل من علماء البيانات إلى مجموعة واسعة من خبراء المجال العاملين في الخطوط الأمامية. ويمكن للمستخدمين إجراء تدريب النماذج، وتقييم أداء النماذج، ونشر النماذج التي تم التحقق من صحتها كخدمات REST API قياسية بنقرة واحدة، مما يمكّن أنظمة الإنتاج اللاحقة من استدعائها مباشرةً، ويشكل حلقة مغلقة تمتد من البيانات إلى القيمة.
صُممت هذه البنية المكونة من أربع طبقات لدعم سير عمل أساسي شامل لخبراء الأعمال، بدءًا من تحديد السيناريو وصولاً إلى نشر النموذج، مما يجعل العملية سلسة وفعالة وسهلة الإتقان.
يكمن جوهر تصميم هذه المنصة في مسار عمل واضح ومبسط للمستخدم يتألف من خمس خطوات، مصمم خصيصًا للجيولوجيين ومهندسي الخزانات. ويمثل مسار العمل هذا جوهر نموذج التشغيل الجديد. ويهدف إلى تمكين الخبراء الأكثر درايةً بالعمل من إتمام العملية بأكملها بشكل مستقل وفعال، بدءًا من تحديد المشكلة العملية وصولاً إلى نشر نموذج الذكاء الاصطناعي، دون الحاجة إلى كتابة أكواد برمجية معقدة. وبهذه الطريقة، يمكن جعل قدرات الذكاء الاصطناعي في متناول قاعدة أوسع من المستخدمين.
طريقة الاستخدام: بعد تسجيل الدخول إلى المنصة، يختار المستخدمون أولاً مجال العمل الذي يهمهم من بين المجالات المحددة مسبقًا، مثل الاستكشاف أو التطوير أو الهندسة، ثم يحددون مهمة تحليلية محددة.
وظائف المنصة: توفر المنصة سلسلة من قوالب سيناريوهات العمل المعدة مسبقًا، مثل «تحديد التركيب الصخري» لمهام التصنيف، و«توقعات إنتاج البئر الواحد» لمهام الانحدار، و«الإنذار المبكر بانحشار الأنابيب أثناء الحفر» للكشف عن الانحرافات في السلاسل الزمنية. يرشد النظام المستخدمين إلى تحديد هدف التنبؤ، أو المتغير المستهدف، بوضوح، مثل توقع نسبة الماء المستقبلية أو تحديد فترات الحجر الرملي عند أعماق محددة.
طريقة الاستخدام: يدخل المستخدمون إلى لوحة النمذجة ويختارون الميزات الموجودة عالية الجودة من سوق الميزات الموجود على الجانب الأيمن عن طريق عمليات السحب والإفلات. وإذا كانت الميزات الموجودة غير كافية لحل المشكلة، فيمكن للمستخدمين إنشاء ميزات جديدة باستخدام الأدوات المدمجة في المنصة.
وظائف المنصة: توفر المنصة أدوات قوية لإنشاء الميزات. على سبيل المثال، يمكن للمستخدمين تحميل تقرير يومي عن الحفر بتنسيق PDF، وستقوم المنصة تلقائيًا باستخراج «كثافة سائل الحفر» من خلال قدرتها على استخراج البيانات غير المنظمة. يمكن للمستخدمين أيضًا اختيار قواعد تنقية محددة مسبقًا تستند إلى القوانين الفيزيائية، مثل تمكين «التحقق من توازن المواد»، مما يسمح للنظام بالتعرف تلقائيًا على البيانات التي تخالف القوانين الفيزيائية وتنقيتها. بالإضافة إلى ذلك، يمكن للمنصة تفعيل التعليق التلقائي القائم على مخطط المعرفة. على سبيل المثال، إذا حدد النظام من مخطط المعرفة أن بئرًا معينًا لديه نتيجة اختبار بئر تشير إلى «فاصل حامل للنفط» عند عمق محدد، فسيقوم تلقائيًا بتصنيف عينات البيانات المقابلة عند ذلك العمق على أنها «فاصل حامل للنفط».
إجراءات المستخدم: بعد إنشاء مجموعة بيانات تحتوي على عشرات السمات المرشحة، يتعين على المستخدمين تحديد العوامل الرئيسية التي لها التأثير الأكبر على هدف التنبؤ، أي العوامل المهيمنة.
وظائف المنصة: توفر المنصة مجموعة من الأدوات المرئية لدعم اتخاذ القرار لتبسيط هذه العملية. تساعد خريطة الحرارة للارتباط المستخدمين على تحديد وإزالة السمات الزائدة التي تعاني من التعددية الخطية. ويمكن لتحليل معامل المعلومات الأقصى (MIC) الكشف عن العلاقات غير الخطية بين السمات والمتغير المستهدف. كما يمكن للمنصة إجراء اختبار سريع مسبق استنادًا إلى نماذج الشجرة، مثل الغابات العشوائية، وعرض ترتيب أهمية كل سمة في مخطط شريطي سهل الفهم، مما يساعد الخبراء على اتخاذ قرارات أكثر استنارة.
طريقة الاستخدام: يختار المستخدمون نموذجًا خوارزميًا واحدًا أو أكثر من «سوبرماركت الخوارزميات» المتوفر على المنصة، ويقومون بضبط المعلمات الرئيسية، أو يستخدمون مباشرةً القيم الافتراضية التي يوصي بها النظام، ثم ينقرون على زر «بدء التدريب».
وظائف المنصة: يدمج «سوبرماركت الخوارزميات» الخاص بالمنصة مكتبات الخوارزميات مفتوحة المصدر الشائعة التي تم التحقق من صحتها في سيناريوهات خاصة بمجالات محددة، ويغطي نطاقًا واسعًا من التطبيقات:
1. نماذج التسلسل، مثل LSTM وTransformer: مناسبة للمهام التي تعتمد على الزمن، مثل توقعات الإنتاج لكل بئر على حدة وإعادة بناء منحنيات سجلات الآبار.
2. نماذج التصنيف والانحدار، مثل XGBoost وRandom Forest: مناسبة لمهام التصنيف الثابتة، مثل تحديد الصخور وتقييم أداء التصدع.
3. نماذج الصور، مثل CNN وU-Net: مناسبة لمهام السمات المكانية، مثل تحديد السمات الزلزالية وتحليل صور العينات الصخرية.
وفي الوقت نفسه، تتمتع المنصة بقدرات مدمجة لضبط المعلمات الفائقة تلقائيًا، أو ما يُعرف بـ «AutoML». ومن خلال تقنيات مثل البحث الشبكي أو التحسين البايزي، يمكن للنظام تحديد التركيبة المثلى للمعلمات الفائقة تلقائيًا، مما يساهم في خفض عتبة النمذجة بشكل أكبر.
إجراءات المستخدم: بعد اكتمال تدريب النموذج، يقوم المستخدمون بمراجعة تقرير تقييم النموذج الذي أنشأه النظام. وبمجرد تأكيدهم أن أداء النموذج يلبي توقعات العمل، ينقرون على زر «النشر بنقرة واحدة».
وظائف المنصة: لا توفر المنصة مقاييس تقييم التعلم الآلي القياسية فحسب، مثل RMSE وAUC، بل توفر أيضًا مقاييس تقييم موجهة للأعمال، مثل معدل الملاءمة التاريخي والتوافق مع اتجاهات ارتفاع نسبة الماء في النفط، مما يجعل نتائج التقييم أكثر توافقًا مع سيناريوهات الإنتاج الفعلية. وبمجرد اجتياز النموذج لعملية التحقق من الصحة، يمكن للمنصة تجميعه في واجهة REST API مستقلة ومعبأة في حاوية بنقرة واحدة، وتسجيله تلقائيًا لدى بوابة خدمات المؤسسة، مما يتيح استدعاءه بسهولة من قبل أنظمة الإنتاج الخارجية.
وراء هذا المسار السلس للعمل تكمن سلسلة من الوحدات التكنولوجية الرئيسية القوية المصممة خصيصًا لصناعة النفط والغاز.
يقدم هذا الفصل تحليلاً متعمقاً لمحركي التكنولوجيا المبتكرين الأساسيين اللذين يشكلان ركيزة قيمة المنصة: «محرك القواعد المستند إلى الفيزياء» و«KG-AutoLabeler». كما يعرض قدرات المنصة القوية في معالجة البيانات متعددة الأنماط. وتشكل هذه الوحدات الأساس لضمان استيفاء البيانات لمعايير الجودة العالية، ولجعل سير عمل معالجة البيانات أكثر ذكاءً.
القيمة الأساسية: يُعد «محرك القواعد المستند إلى الفيزياء» وحدة أساسية لضمان جودة البيانات ومواءمتها مع القوانين الموضوعية للجيولوجيا وهندسة الخزانات. ومن خلال دمج الخبرة المتخصصة في المجال والصيغ الفيزيائية في عملية تنقية البيانات، يعالج هذا المحرك بشكل جذري المشكلة الرئيسية التي تعاني منها الأساليب التقليدية لتنقية البيانات القائمة على تكنولوجيا المعلومات، والتي قد تؤدي عن طريق الخطأ إلى حذف معلومات تجارية بالغة الأهمية. ويضمن ذلك أن تكون البيانات التي يتم إدخالها في النماذج علمية وموثوقة منذ البداية.
آلية التنفيذ: يحتوي المحرك على مكتبة قواعد قابلة للتوسيع تغطي القيود الفيزيائية الشائعة في مجال استكشاف وتطوير النفط والغاز. ويمكن للمستخدمين تفعيل هذه القواعد من خلال عملية اختيار أو تهيئة بسيطة.
قيود النطاق: يتم تحديد نطاقات قيم معقولة للمعلمات الفيزيائية. على سبيل المثال، تتراوح المسامية φ للحجر الرملي عادةً بين 0 و40%: 0<φ< 40%.
قيود الاتجاهات: يتم تحديد الاتجاهات الإلزامية لتغيرات البيانات فيما يتعلق بمتغير معين، مثل العمق أو الزمن. على سبيل المثال، يجب أن تزداد قيم العمق التراكمية في مقطع سحب المياه لبئر حقن بشكل متناسق مع زيادة العمق.
قيود الآلية: يتم التحقق من الصحة استنادًا إلى المعادلات الهندسية الكلاسيكية أو القوانين الفيزيائية. على سبيل المثال، يجب أن يكون ضغط التدفق عند قاع البئر (Pwf) أكبر من الصفر: Pwf> 0، ويجب ألا يتجاوز الإنتاج اليومي للمياه من بئر واحد إنتاجه اليومي من السوائل.
القواعد التي يحددها المستخدم: تتيح المنصة للمستخدمين تحديد قواعد تحقق تجارية جديدة بطريقة بسيطة وبديهية، على غرار صيغ برنامج Excel. على سبيل المثال: IF(Col_A > Col_B * 1.5, "Anomaly", "Normal")
وهذا يوفر لخبراء الأعمال درجة عالية من المرونة.
القيمة الأساسية: صُممت هذه الوحدة لمعالجة التحديات الرئيسية التي تواجه عملية تصنيف البيانات التقليدية بشكل جذري، والتي تعتمد بشكل كبير على مشاركة الخبراء، وتعاني من انخفاض الكفاءة، وتترتب عليها تكاليف باهظة. ومن خلال الاستفادة من الأصول المعرفية المتراكمة بالفعل داخل المؤسسة، تتيح هذه الوحدة تصنيف البيانات على نطاق واسع بشكل آلي وفعال.
مبدأ التنفيذ: يتمثل مبدأه الأساسي في إنشاء التسميات تلقائيًا باستخدام العلاقات المنظمة بين الكيانات الموجودة والأحداث الجيولوجية في مخطط المعرفة. يربط مخطط المعرفة المعلومات مثل الآبار والطبقات والصدوع في بنية قائمة على المخططات، مما يمكّن الآلات من الاستدلال بطريقة مشابهة لطريقة خبراء المجال.
سير العمل: لنأخذ تصنيف الصخور في منحنيات قياس الآبار كمثال:
1. المدخلات: تتلقى المنصة مجموعة بيانات خاصة بتسجيل آبار النفط لتصنيفها، وتحتوي هذه المجموعة على أسماء الآبار ومعلومات عن عمقها.
2. الاستعلام: يقوم النظام تلقائيًا بالاستعلام عن مخطط المعرفة لتحديد ما إذا كانت هناك أحداث جيولوجية ذات صلة بالفاصل العمقي المقابل للبئر، مثل «استنتاجات اختبار البئر» أو «استنتاجات تسجيل الطين».
3. التعيين والتعبئة التلقائية: إذا أخرجت مخطط المعرفة استنتاجًا مثل «طبقة حاملة للنفط»، يقوم النظام تلقائيًّا بتعبئة التسمية المقابلة في مجموعة البيانات استنادًا إلى قواعد تعيين محددة مسبقًا. على سبيل المثال، قد يتم تعيين «طبقة حاملة للنفط» إلى التسمية الرقمية 1، وبذلك تكتمل عملية التسمية التلقائية.
القيمة الأساسية: تتمثل المهمة الأساسية لهذه الوحدة في تفعيل الكم الهائل من البيانات غير المنظمة وشبه المنظمة المخزنة في أنظمة ملفات المؤسسات، مثل التقارير اليومية لإنتاج ملفات PDF، والتقارير الفنية، والصور الأساسية أو صور المقاطع الرقيقة بتنسيقات BMP/JPG. وتقوم هذه الوحدة بتحويل أصول البيانات هذه إلى سمات منظمة يمكن حسابها وتحليلها واستخدامها بواسطة النماذج.
نهج التنفيذ: بالنسبة لأنواع البيانات المختلفة، تعتمد الوحدة على مسارات تحليل مخصصة.
1. مسار معالجة OCR/NLP: بالنسبة للتقارير الممسوحة ضوئيًا بصيغة PDF، يعمل هذا المسار على تحويل المحتوى النصي غير المنظم إلى معلومات منظمة من نوع «القيمة-المفتاح» من خلال خطوات مثل تحسين الصورة، واكتشاف الجداول، والتعرف الضوئي على الحروف (OCR)، واستخراج الكيانات. على سبيل المثال، يمكنه استخراج الكيانات والقيم الرئيسية بدقة، مثل «ضغط الزيت»، و«ضغط الغلاف»، و«إنتاج السوائل» من سجلات الإنتاج.
2. استخراج ميزات الصورة: بالنسبة لبيانات الصور مثل صور العينات وصور المقاطع الرقيقة، تستخدم المنصة شبكات التعلم العميق التي تم تدريبها مسبقًا على مكتبات صور واسعة النطاق، مثل ResNet، لتحويل كل صورة إلى متجه رياضي عالي الأبعاد، يُعرف أيضًا باسم «التضمين». يجمع هذا المتجه الميزات البصرية الأساسية للصورة، مما يسمح للنموذج بمعالجة النسيج البصري للصخور كميزة رياضية، وبالتالي تحديد العلاقات الجوهرية بين الأنماط البصرية ونتائج الإنتاج.
يعتمد تنفيذ هذه الوحدات التقنية الرئيسية على مجموعة تقنيات حديثة تم اختيارها بعناية، تستند في المقام الأول إلى تقنيات مفتوحة المصدر.
إن منصة مجموعات البيانات عالية الجودة، التي تستند إلى منهجيات قائمة على المعرفة ومتكاملة مع مبادئ الفيزياء، كما هو موضح في هذه الورقة البيضاء، هي أكثر بكثير من مجرد مجموعة من الأدوات. فهي تمثل منهجية وإطار عمل عمليًّا مصممًا لدفع عجلة التحول الرقمي والذكي في مجال استكشاف وتطوير النفط والغاز. ومن خلال معالجة الاختناقات في السلسلة الكاملة بشكل منهجي — بدءًا من البيانات وصولاً إلى القيمة — ستحقق المنصة تحولًا عميقًا ودائمًا للمؤسسات.
يمكن تلخيص القيم الأساسية الأربعة للتطبيق على هذه المنصة على النحو التالي:
تحويل البيانات إلى أصول
من خلال عمليات التحليل الذكي وتنقية البيانات وتكاملها، تعمل المنصة على تحويل البيانات الأولية الموجودة في بحيرات البيانات — والتي يصعب فهمها واستخدامها — إلى أصول مميزة عالية القيمة يمكن حسابها وتحليلها وإعادة استخدامها. ويتيح سوق الميزات الناتج عن ذلك، والمصمم على مستوى المؤسسات، تجميع البيانات بشكل حقيقي باعتبارها أصلًا أساسيًّا قابلًا للقياس والإدارة ويعزز القيمة باستمرار.
كفاءة الأعمال
من خلال إدخال تقنيات ثورية مثل التنظيف الآلي القائم على قيود مستندة إلى مبادئ الفيزياء، والتصنيف الآلي القائم على الرسوم البيانية المعرفية، يمكن للمنصة أن تقصر بشكل كبير دورة الإعداد اللازمة لبناء مجموعة بيانات سيناريوهات عالية الجودة. فما كان يتطلب تقليديًا عدة أشهر من الجهد اليدوي يمكن اختصاره إلى بضعة أيام فقط، مما يسرع بشكل كبير من عمليات التكرار ونشر تطبيقات الذكاء الاصطناعي.
دمقرطة القدرات
من خلال واجهة نمذجة بصرية تعتمد على تقنية «البرمجة المحدودة/بدون برمجة»، تزود المنصة الجيولوجيين ومهندسي الخزانات العاملين في الخطوط الأمامية — والذين هم الأكثر درايةً بطبيعة العمل — بقدرات متقدمة في مجال علم البيانات ونمذجة الذكاء الاصطناعي. وهذا يمكّنهم من بناء نماذج البيانات الضخمة بشكل مستقل وحل مشكلات الإنتاج الفعلية بطريقة تعتمد على البيانات، مما يؤدي إلى تعظيم التأثير المضاعف للمعرفة المتخصصة وقيمة البيانات.
اتخاذ القرارات العلمية
من خلال دمج مبادئ الهندسة الجيولوجية وهندسة الخزانات — ولا سيما الآليات الفيزيائية — بشكل عميق في مسار عمل معالجة البيانات بأكمله، تضمن المنصة أن تكون البيانات المستخدمة لتدريب النموذج متوافقة مع المنطق العلمي السليم منذ البداية. وهذا لا يؤدي فقط إلى تحسين متانة النموذج وقابليته للتفسير ودقة تنبؤاته بشكل كبير، بل يوفر أيضًا أساسًا علميًا متينًا لتوصيات اتخاذ القرار التي يولدها النموذج، مما يعزز موثوقية عملية اتخاذ القرار الذكي.
وبالنظر إلى المستقبل، ستتطور المنصة لتتجاوز كونها مجرد أداة للنمذجة لتصبح «منظومة وكلاء ذكية» أكثر شمولاً. وضمن هذه المنظومة:
سيتم تغليف كل نموذج مدرب في شكل «مشغل أعمال» قابل لإعادة الاستخدام، مثل مشغل تحديد الصخور أو مشغل توقع الإنتاج.
سيتمكن الوكلاء ذوو المستويات الأعلى من تنسيق واستدعاء مجموعات من «مشغلي الأعمال» هؤلاء تلقائيًا استنادًا إلى مشكلات معقدة ومتعددة الخطوات في مجالي الجيولوجيا وهندسة الخزانات. وبهذه الطريقة، يمكنهم إنجاز مهام تحليلية شاملة بشكل مستقل، مما يتيح تحقيق قفزة نوعية من دعم اتخاذ القرار إلى التحليل المستقل.
وفي الوقت نفسه، ستعمل المنصة بنشاط على استكشاف تقنيات «التعلم الاتحادي» (Federated Learning) لتمكين النمذجة التعاونية عبر المؤسسات والمناطق، مع ضمان خصوصية البيانات وأمنها. وسيساعد ذلك في مواجهة التحدي المتمثل في «صوامع البيانات». بالإضافة إلى ذلك، ستعمل المنصة على إنشاء بيئة تفاعل مرئي أكثر ثراءً، مما يتيح التكامل العميق بين نتائج النماذج والخرائط المتخصصة.
نحن نؤمن إيمانًا راسخًا بأن تطوير هذه المنصة وتطبيقها سيوفران زخمًا قويًّا للتحديث الذكي لصناعة النفط والغاز، مما سيفتح الباب أمام عصر جديد تقوده البيانات وتدعمه المعرفة.
من نحن