٥٠,٠٠٠ محادثة · JSONL · جاهزة للتنزيل

محادثات عربية سعودية
مجموعة بيانات للذكاء الاصطناعي

٥٠,٠٠٠ محادثة خدمة عملاء اصطناعية بلهجات سعودية أصيلة. مصممة لضبط نماذج اللغة الكبيرة وتدريب الشات بوت والبحث في معالجة اللغة الطبيعية.

الصيغة: JSONL.اللغة: العربية السعوديةالرخصة: استخدام تجاريالبيانات الشخصية: لا يوجد
0+
محادثة
0
لهجات سعودية
0
قطاعات صناعية
~0MB
حجم الملف
اللهجات
النجدية (الرياض / القصيم)~12,500
الحجازية (جدة / مكة)~12,500
الشرقية (المنطقة الشرقية)~12,500
العامة / اللكنة البيضاء~12,500
القطاعات
التقنية المالية (المحفظة الرقمية)~12,500
الاتصالات (إنترنت / 5G)~12,500
التوصيل (طعام / لوجستيات)~12,500
الخدمات الحكومية (محاكاة)~12,500
مخطط الصف (JSONL)
{
  "id":           "uuid",
  "status":       "completed",
  "metadata":     { "dialect": "Najdi", "sector": "Fintech", "sentiment": "Angry", "topic": "Transfer Failed" },
  "conversation": [ { "role": "user", "content": "..." }, { "role": "agent", "content": "..." } ],
  "slug":         "transfer-failed-a1b2c3"
}
بيانات حقيقية من المجموعة

محادثات نموذجية

يستطيع الزائر تصفح محادثات مكتملة حقيقية، والتنزيل يقتصر فقط على أول 500 مثال بصيغة العرض العام.

مثال 1 · Late Delivery
الموضوع: Late Deliveryاللهجة: Najdi (Riyadh/Qassim)القطاع: Delivery (Food/Logistics)المزاج: Angry/Frustrated
العميل حولني على المشرف الحين، ما أبي أضيع وقتي معك. مهزلة والله اللي قاعد يصير في طلبي، ساعتين أنتظر وعشاي ما وصل!
الموظف أبشري وحقك علينا يا أخت منال، معك خالد وبإذن الله ما تنهين المكالمة إلا وأنتِ راضية. بس لا هنتِ عطيني رقم الطلب عشان أشوف وش صاير بالضبط.
العميل رقم الطلب M2TSGAO، والطلب قيمته ١١٥ ريال ودافعته فيزا. وش ذا الاستهتار؟ السائق واقف في مكانه ما تحرك من نص ساعة!
الموظف سمي، شيكت على النظام وفعلاً الطلب M2TSGAO متأخر عند المطعم والسائق ينتظرهم. ولا يهمك، الحين سحبت الطلب من السائق الأول وخصصت لك سائق
العميل وش ينفعني فيه السائق الجديد؟ الأكل أكيد برد الحين وخرب. أنا أبي فلوسي ترجع لي الحين ولا والله بصعد الموضوع لهيئة الاتصالات!
الموظف حقك كامل وما نرضى بغير كذا. أبشرك كنسلت الطلب القديم تماماً، وبرجع لك الـ ١١٥ ريال كاملة في محفظتك في طلبي الحين، وتقدرين تطلبين من جديد ويوصلك حار.
العميل طيب والمحفظة وش بستفيد منها؟ أنا أبيها ترجع للفيزا. وبعدين وش يضمن لي إن الطلب الثاني ما يتأخر مثله؟
الموظف طال عمرك، المبلغ نزل في المحفظة كحل فوري، وإذا تبينها للفيزا رفعت لك طلب استرداد للبنك وبتاخذ ٣ أيام عمل. وفوقها أضفت لك كود خصم خاص تعويضاً عن اللي صار.
العميل يعني الحين أقدر أطلب بالكود هذا ويطلع لي التوصيل مجاني؟ لأن الصراحة اللي صار اليوم كرهني في الخدمة.
الموظف تم يا طويلة العمر، الكود يعطيك توصيل مجاني وخصم إضافي بعد. والمبلغ صار متاح في حسابك الحين تقدرين تستخدمينه فوراً لو حبيتي.
العميل زين، أشوف المبلغ نزل في المحفظة. أهم شي لا يتكرر ذا التأخير مرة ثانية لأننا تعبنا من كثر الشرح للسائقين.
الموظف بإذن الله ما يتكرر، وتابعت ملاحظتك مع قسم العمليات بخصوص السائق والمطعم. تامرين على شيء ثاني يا أخت منال؟

العرض العام يحتوي حالياً على 100 محادثات مكتملة · والتنزيل محدود بأول 100 صف فقط.

ماذا بالداخل

كل صف بجودة إنتاجية

كل محادثة تتضمن بيانات وصفية غنية، علامات لهجة أصيلة، مفردات خاصة بكل علامة تجارية، وأنماط حل واقعية — وليست قوالب مكررة.

١٢+ موضوع

مشاكل OTP، رسوم غير معروفة، نزاعات فواتير، طلبات ناقصة، حسابات مقفلة، تحويلات فاشلة، استبدال شرائح، حجز مواعيد، والمزيد.

٤ أنماط مشاعر

غاضب/محبط، مستعجل/قلق، حائر/مستفسر، محايد/مهذب — لكل نمط أسلوب افتتاح وتصعيد مختلف.

نتائج واقعية

ليست كل حالة تُحل بسحر. ٤٠٪ حل كامل، ٣٠٪ حل جزئي، ٢٠٪ تصعيد، ١٠٪ بدون حل — تعكس بيانات مراكز الاتصال الحقيقية.

١٨ علامة تجارية خيالية سعودية

أسماء خيالية لكنها واقعية عبر المحافظ الرقمية، مزودي الاتصالات، تطبيقات التوصيل، والخدمات الحكومية — بقدرات دقيقة لكل قطاع.

من يشتري هذا

مصمم لفرق الذكاء الاصطناعي العربي

ضبط نماذج اللغة الكبيرة

أضف ملف JSONL مباشرةً إلى خط أنابيب التدريب. جاهز للاستخدام مع Hugging Face وAxolotl وLLaMA-Factory.

تدريب الشات بوت

ابنِ بوتات خدمة عملاء سعودية تبدو حقيقية. مفردات لهجة أصيلة، لا عربية فصحى مترجمة.

أبحاث معالجة اللغة العربية

تحليل المشاعر، تصنيف اللهجات، استخراج الكيانات. بيانات وصفية موسومة مع كل صف.

١٠٠٪ اصطناعي — بدون بيانات مستخدمين حقيقيين
خالٍ من البيانات الشخصية — آمن وفق NDMO وGDPR
تحقق من اللهجة — قوائم كلمات محظورة صارمة
تسليم فوري عبر واتساب
جودة البيانات

كل صف يجتاز ٢٠+ فحص آلي

لا نكتفي بالتوليد — نتحقق. كل محادثة تمر بعدة طبقات من فحوصات الجودة قبل دخولها المجموعة.

٩٥٪
نسبة النجاح الآلي في أحدث دفعة
+٢٠
فحص جودة لكل محادثة
٣×
إعادة توليد عند الفشل

نقاء اللهجة

الشامي والمصري والمغربي يُرفض تلقائياً. فقط المفردات السعودية الأصيلة تمر.

واقعية العلامة التجارية

١٨ علامة تجارية سعودية بقواعد قدرات مُطبَّقة. الموظف لا يقدم خدمات لا توفرها علامته.

بدون عبارات روبوتية

عبارات القوالب مثل "هل يمكنني مساعدتك" ممنوعة. كل موظف يبدو كموظف خدمة عملاء سعودي حقيقي.

تنوع الحلول

ليست كل حالة تحل بسحر. النظام يفرض تصعيدات واقعية وحلول جزئية وقيود حقيقية.

تردد لهجة طبيعي

علامات اللهجة محددة بسقف. لا محادثة تستخدم يا خوي ٥ مرات — هذا كاريكاتير وليس بيانات.

سلامة هيكلية

ترتيب الأدوار، عدد الجولات، مسار التحقق، وذكر العلامة التجارية — كلها تُفحص قبل اعتماد الصف.

أسئلة شائعة

الأسئلة الأكثر شيوعاً

تسعير بسيط

مجموعة بيانات واحدة. سعر واحد.

$299
دفعة واحدة · تسليم فوري
  • ٥٠,٠٠٠ محادثة (JSONL)
  • ٤ لهجات سعودية موسومة بالكامل
  • ٤ قطاعات بمفردات حقيقية
  • بيانات وصفية لكل صف (لهجة، قطاع، مزاج، موضوع)
  • رخصة استخدام تجاري
  • تسليم الملف مباشرة عبر واتساب
  • +٢٠ فحص جودة لكل صف
  • عرض مجاني لأول ٥٠٠ صف
غير راضٍ؟ استرداد كامل خلال ٢٤ ساعة.
اشتر عبر واتساب

راسلنا على واتساب — سنؤكد ونرسل الملف مباشرةً.