vsevolodl's picture
Upload folder using huggingface_hub
c07fd60 verified
metadata
language:
  - multilingual
license: apache-2.0
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - dense
  - generated_from_trainer
  - dataset_size:79716
  - loss:MatryoshkaLoss
  - loss:MultipleNegativesRankingLoss
base_model: Qwen/Qwen3-Embedding-0.6B
widget:
  - source_sentence: >-
      Who were some of the scholars mentioned as having transmitted knowledge
      from Hammad ibn Abi Qatada?
    sentences:
      - >-
        بن أبي ثابت وغيرهم. وعنه ابن المبارك وحسين بن علي \n\nالجعفي وعبد الله
        بن صالح العجلي وأبو أحمد الزبيري وغيرهم. قال العجلي: ثقة، وقال أبو
        حنيفة: غلب حمزة الناس على القرآن والفرائض. وقال الثوري: ما قرأ حمزة حرفا
        من كتاب الله إلا بأثر. قال ابن حجر: انعقد الإجماع على تلقي قراءته
        بالقبول. لكن نقل صاحب المغني (1/492 ط 3) عن أحمد أنه كان يكره قراءة حمزة
        والكسائي لما فيها من الكسر والإدغام والتكلف وزيادة المد. (تهذيب التهذيب
        3/27، وميزان الاعتدال 1/605، ووفيات الأعيان 1/167، والأعلام 2/308).
        \n\nخ \n\nخباب بن الأرت (؟ - 37 ه): \n\nهو خباب بن الأرت بن جندلة بن
        سعد، أبو يحيى أو أبو عبد
      - >-
        عين ودين على الغير - ولم نجوز بيع الدين لغير من هو عليه - بطل الصلح في
        الدين، وفي العين القولان في تفريق الصفقة. \n\nولو مات شخص عن ابنين،
        والتركة ألفا درهم ومائة دينار، وهي دين في ذمة الغير، فصالح أحدهما أخاه
        من الدين على ألفي درهم جاز؛ لأنه إذا كان في الذمة فلا ضرورة إلى تقدير
        المعاوضة فيه، فيجعل مستوفيا لأحد الألفين ومعتاضا عن الدنانير الألف
        الآخر(). \n\nظهور دين على التركة بعد التخارج: \n\n20 - الأصل أن الدين
        يتعلق بالتركة، ويقدم سداده على تقسيم التركة؛  :  من بعد وصية يوصى بها أو
        دين(). \n\nلكن الفقهاء يختلفون في وقت ابتداء ملكية الوارث للتركة إذا
        كانت مدينة. \n\nفعند
      - >-
        ولعل العام هو المتأخر الذي أريد به العموم، وينسخ به الخاص، وهذا هو الذي
        اختاره القاضي، والأصح عندنا: تقديم الخاص وإن كان ما ذكره \n\nالقاضي
        ممكنا، ولكن تقدير النسخ محتاج إلى الحكم بدخول الكافرة تحت اللفظ، ثم
        خروجه عنه، فهو إثبات وضع، ورفع بالتوهم، وإرادة الخاص باللفظ العام غالب
        معتاد، بل هو الأكثر، والنسخ كالنادر، فلا سبيل إلى تقديره بالتوهم، ويكاد
        يشهد لما ذكرناه من سير الصحابة والتابعين كثير، فإنهم كانوا يسارعون إلى
        الحكم بالخاص على العام، وما اشتغلوا بطلب التاريخ والتقدم والتأخر().
        \n\nوقيل على الشذوذ: إنه يخصص من طريق المفهوم، فإن الرجال يقتضي مفهومه
        قتل غيرهم، فإذا لم
  - source_sentence: كيف يؤثر حصول الشخص على قليل من النقد مقابل نصاب أكبر في الحول التجاري؟
    sentences:
      - >-
        للنساء لما سبق بيانه، وكرهه الحنفية والحنابلة(). \n\nالتصفيق في الصلاة
        على وجه اللعب : \n\n7 - قال الشافعية، وهو أحد قولي الحنابلة: إن التصفيق
        في الصلاة على وجه اللعب يبطلها وإن كان قليلا، لمنافاة اللعب للصلاة.
        والأصل في ذلك حديث الصحيحين: «من نابه شيء في صلاته فليسبح، وإنما التصفيق
        للنساء». ولمنافاته للصلاة. \n\nوالقول الآخر للحنابلة: أنه لا يبطلها إن
        قل، وإن كثر أبطلها؛ لأنه عمل من غير جنسها، فأبطلها كثيره عمدا كان أو
        سهوا(). \n\nوأما الحنفية فقد قالوا: إن ما يعمل عادة باليدين يكون كثيرا،
        بخلاف ما يعمل باليد الواحدة فقد يكون قليلا، والعمل الكثير الذي ليس من
        أفعال الصلاة ولا
      - >-
        موسى : واجعل لي وزيرا من أهلي هارون أخي اشدد به أزري وأشركه في أمري()
        فإذا جاز ذلك في النبوة كان في الإمامة أولى، ولأن ما وكل إلى الإمام من
        تدبير الأمة لا يقدر على مباشرة جميعه إلا باستنابة، ونيابة الوزير المشارك
        له في التدبير أجدى في تنفيذ الأمور من تفرده بها، ليستظهر به على نفسه،
        وبها يكون أبعد من الزلل وأمنع من الخلل. \n\nقال الماوردي وأبو يعلى ما
        مفاده:() يشترط في لفظ تولية وزارة التفويض اشتماله على أمرين: \n\nأحدهما:
        عموم النظر، والثاني: \n\nالنيابة، فإن اقتصر على عموم النظر دون النيابة
        فكان بولاية العهد أخص فلم تنعقد به الوزارة، وإن اقتصر به على النيابة فقد
        أبهم ما
      - >-
        بالدراهم وباع بالدنانير، وقصد التجارة مستمر، وتم الحول، فلا زكاة إن لم
        تبلغ الدنانير قيمة الدراهم. وهناك قول في المذهب أن التقويم يكون أبدا
        بغالب نقد البلد. \n\nالحالة الثانية: أن يكون رأس المال نقدا دون النصاب،
        وفيه وجهان: \n\nأصحهما: أنه يقوم بذلك النقد. \n\nوالثاني: أنه يقوم بغالب
        نقد البلد. ومحل الوجهين إن لم يملك ما يتم به النصاب. فإن ملك قوم به.
        وصورته: أن يشتري بمائة درهم وهو يملك مائة أخرى، فلا خلاف أن التقويم
        بالدراهم. لأنه اشترى ببعض ما انعقد عليه الحول، وابتدأ الحول من حين ملك
        الدراهم. \n\nالحال الثالث: أن يملك بالنقدين جميعا. وهو على ثلاثة أضرب.
        \n\nالأول: أن يكون كل
  - source_sentence: كيف يرى الشافعية حقيقة إسلام المميز كاستقلال من غير افتقار؟
    sentences:
      - >-
        ذلك عن عمر ، وبه يقول شريح والقاسم بن محمد وسالم بن عبد الله والأوزاعي
        وابن أبي ليلى ومالك والشافعي وعبد الملك بن يعلى قاضي البصرة(). \n\nوفي
        كشاف القناع: إذا عزر من وجب عليه التعزير وجب على الحاكم أن يشهره لمصلحة
        كشاهد زور ليجتنب(). \n\nوجاء في التبصرة: التعزير لا يختص بالسوط واليد
        والحبس، وإنما ذلك موكول إلى اجتهاد الإمام. قال أبو بكر الطرطوشي في أخبار
        الخلفاء المتقدمين: إنهم كانوا يعاملون الرجل على قدره وقدر جنايته، فمنهم
        من يضرب، ومنهم من يحبس، ومنهم من يقام واقفا على قدميه في المحافل، ومنهم
        من تنزع عمامته. \n\nقال القرافي: إن التعزير يختلف باختلاف الأعصار
        والأمصار، فرب
      - >-
        الحنفية والمالكية والحنابلة وبعض الشافعية إلى أن إسلام المميز يصح
        استقلالا من غير افتقار إلى حكم حاكم، أو تبعيته لأحد أبويه؛ لأن النبي 
        دعا عليا  إلى الإسلام، وهو ما زال في صباه فأسلم، وكان أول من أسلم من
        الصبيان؛ ولقوله : «كل مولود يولد على الفطرة»()؛ ولأن الإسلام عبادة محضة
        فصحت من الصبي العاقل كالصلاة والصوم والحج وغيرها من العبادات. \n\nويرى
        الشافعية في الراجح عندهم أن إسلام المميز استقلالا لا يصح؛ لأنه غير مكلف
        بدليل قوله : «رفع القلم عن ثلاثة عن النائم حتى يستيقظ وعن الصبي حتى
        يحتلم وعن المجنون حتى يفيق» وفي رواية: «وعن الصبي حتى يبلغ»(). \n\nولأن
        نطقه بالشهادتين إما
      - >-
        سنا ولا ظفرا، فلا يحل ما ذبح بهما أو صيد بهما. وفرق بعض الفقهاء بين السن
        والظفر القائمين فمنع الذبح بهما، بخلاف المنزوعين. ولا يحل ما أزهقت نفسه
        بمثقل كالحجر ونحوه. وينبغي تعاهد الآلة لتكون محددة فتريح الذبيحة.
        \n\nوإن كان المصيد به حيوانا كالكلب والصقر ونحوهما اعتبر أن يكون معلما.
        ومعنى التعليم في الجارحة أن تصير بحيث إذا أرسلت أطاعت، وإذا \n\nزجرت
        انزجرت، وقيل بأن تترك الأكل من الصيد ثلاث مرات. \n\nويذكر الفقهاء تفصيل
        ذلك والخلاف فيه في مباحث الصيد ومباحث الذبح(). \n\nآلات الجهاد: \n\n5 -
        يجب إعداد العدة للجهاد، وتجوز مقاتلة العدو بالسلاح المناسب لكل عصر، وفي
        تحريقهم بالنار
  - source_sentence: >-
      ما هي الأحكام القانونية التي يحكم بها الفقهاء على عقد "المضاربة" وما هو
      موقفهم منها؟
    sentences:
      - >-
        ما بعد البلوغ ما دامت الحاجة قائمة لذلك. \n\n53 - والعلة في هذا الترخيص
        تدريبهن عن شأن تربية الأولاد، وتقدم النقل عن الحليمي: أن من العلة أيضا
        استئناس الصبيان وفرحهم(). وأن ذلك يحصل لهم به النشاط والقوة والفرح وحسن
        النشوء ومزيد التعلم. فعلى هذا لا يكون الأمر قاصرا على الإناث من
        \n\nالصغار، بل يتعداه إلى الذكور منهم أيضا. وممن صرح به أبو يوسف: ففي
        القنية عنه: يجوز بيع اللعبة، وأن يلعب بها الصبيان(). \n\n54 - ومما يؤكد
        جواز اللعب المصورة للصبيان - بالإضافة إلى البنات - ما ثبت في الصحيحين عن
        الربيع بنت معوذ الأنصارية  أنها قالت: «أرسل رسول الله  غداة عاشوراء إلى
        قرى الأنصار
      - >-
        وأما ما يتصل بالإبضاع فإن الصيغة اللفظية قد تكون \n\nصريحة بلفظ الإبضاع،
        أو البضاعة، وقد تكون غير صريحة، كأن يقول: خذ هذا المال مضاربة، على أن
        يكون الربح كله لي. وهذه الصورة محل خلاف بين الفقهاء(). فذهب الحنابلة إلى
        أن هذا العقد لا يصح، واعتبروا ذلك من باب التناقض؛ لأن قوله: «مضاربة»
        يقتضي الشركة في الربح، وقوله: «الربح كله لي» يقتضي عدمها، فتناقض قوله،
        ففسدت المضاربة، ولأنه اشترط اختصاص أحدهما بالربح، وهذا شرط يناقض العقد
        ففسد، ولأن اللفظ الصريح في بابه لا يكون كناية في غيره، فالمضاربة لا
        تنقلب إبضاعا ولا قرضا. وعلى هذا اعتبروا هذا العقد مضاربة فاسدة().
        \n\nوذهب الحنفية
      - >-
        فقيه، أصولي، متكلم، نحوي، كان شيخ الشافعية في بلاد اليمن. تفقه على
        جماعات منهم: خاله الإمام أبو الفتوح بن عثمان العمراني وزيد بن عبد الله
        اليافعي وغيرهما. \n\nمن تصانيفه: «البيان» في فروع الشافعية، و«غرائب
        الوسيط»، و «الزوائد»، و «الأحداث»، و «شرح الوسائل»، و «مختصر الإحياء»، و
        «مناقب الإمام الشافعي». \n\n(طبقات الشافعية 4/324، وشذرات الذهب 4/185،
        والأعلام 9/180، ومعجم المؤلفين 13/196). \n\nيسيرة الصحابية (؟ -؟) هي
        يسيرة أم ياسر. وقيل: يسيرة بنت ياسر، الصحابية المهاجرة . كانت من
        المهاجرات الأول المبايعات. وقال \n\nابن سعد: أسلمت وبايعت وروت عن رسول
        الله (حديثا. \n\n(الإصابة
  - source_sentence: >-
      What is the procedure for increasing or decreasing penalties in cases like
      those described in the text?
    sentences:
      - >-
        المحتاج شرح المنهاج»؛ و «الإيعاب شرح العباب المحيط بمعظم نصوص الشافعية
        والأصحاب»؛ و «الصواعق المحرقة في الرد على أهل البدع والزندقة»؛ و «إتحاف
        أهل الإسلام بخصوصيات الصيام». \n\n(البدر الطالع 1 \\ 109؛ ومعجم المؤلفين
        2 \\ 152؛ والأعلام للزركلي 1 \\ 223) \n\nابن حزم (384 -456 ه) \n\nهو علي
        بن أحمد بن سعيد بن حزم الظاهري. أبو محمد. عالم الأندلس في عصره. أصله من
        الفرس. أول من أسلم من أسلافه جد له كان يدعى يزيد مولى ليزيد بن أبي سفيان
        . كانت لابن حزم الوزارة وتدبير المملكة، فانصرف عنها إلى التأليف والعلم.
        كان فقيها حافظا يستنبط الأحكام من الكتاب والسنة على طريقة أهل الظاهر،
        بعيدا عن
      - >-
        آت بالدين في وقت كذا فأنا مسلم أو مؤمن، ونحو ذلك من الشروط التي يعلق
        عليها، فلا يلزم إسلام إذا وجد ذلك الشرط، بل يبقى على كفره بسبب أن الدخول
        في الدين يعتمد الجزم بصحته والمعلق ليس جازما(). \n\nأما العقود فيرى
        جمهور الفقهاء أن الأصل فيها أن تكون منجزة وعلى وجه الخصوص في التمليكات
        والنكاح، وأجازوا التعليق في الطلاق بناء على قاعدة من ملك التنجيز ملك
        التعليق(). \n\nومنهم من أجاز تعليق البيع في بعض صوره كالشافعية.
        \n\nومنهم من أجاز تعليق العقود بإطلاق كبعض الحنابلة. \n\nقال ابن القيم:
        إن تعليق العقود والفسوخ والتبرعات والالتزامات وغيرها بالشروط أمر قد تدعو
        إليه الضرورة أو الحاجة
      - >-
        العلانية، ما لفلان هذا عليك ولا قبلك هذا المال الذي ادعاه، وهو كذا وكذا،
        ولا شيء منه. وللقاضي أن يزيد على هذا في التغليظ وينقص، وليس عندهم
        التغليظ بالزمان والمكان؛ لأن المقصود تعظيم المقسم به، وهو حاصل بدون ذلك.
        وفي إيجاب التغليظ حرج على القاضي. وهم مجمعون على أن من وجهت إليه اليمين
        لا يعتبر ناكلا إن أبى التغليظ(). \n\nالتحالف: \n\n27 - مصدر تحالف، ومن
        معانيه في اللغة: طلب كل من المتداعيين يمين الآخر. وهذا المعنى هو الموافق
        للشرع. غاية الأمر أن التحالف يكون أمام القضاء(). \n\nوالمراد هنا حلف
        المتخاصمين في مجلس القضاء. \n\nإذا اختلف البائع والمشتري في مقدار الثمن
        أو المبيع أو
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
model-index:
  - name: Qwen/Qwen3-Embedding-0.6B
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 1024
          type: dim_1024
        metrics:
          - type: cosine_accuracy@1
            value: 0.3410022245638684
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.5064395269874722
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.5721227022596885
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.655309682706943
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.3410022245638684
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.1688131756624907
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.11442454045193769
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.0655309682706943
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.3410022245638684
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.5064395269874722
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.5721227022596885
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.655309682706943
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.4919469504004404
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.4404047330987915
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.44857536994508135
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 256
          type: dim_256
        metrics:
          - type: cosine_accuracy@1
            value: 0.2982086406743941
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.4490691956445381
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.5165086055497015
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.6008078679311556
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.2982086406743941
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.14968973188151272
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.10330172110994028
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.060080786793115556
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.2982086406743941
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.4490691956445381
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.5165086055497015
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.6008078679311556
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.44139225396972825
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.39132710474034305
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.40018603040672085
            name: Cosine Map@100

Qwen/Qwen3-Embedding-0.6B

This is a sentence-transformers model finetuned from Qwen/Qwen3-Embedding-0.6B. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: Qwen/Qwen3-Embedding-0.6B
  • Maximum Sequence Length: 192 tokens
  • Output Dimensionality: 1024 dimensions
  • Similarity Function: Cosine Similarity
  • Language: multilingual
  • License: apache-2.0

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 192, 'do_lower_case': False, 'architecture': 'Qwen3Model'})
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': True, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'What is the procedure for increasing or decreasing penalties in cases like those described in the text?',
    'العلانية، ما لفلان هذا عليك ولا قبلك هذا المال الذي ادعاه، وهو كذا وكذا، ولا شيء منه. وللقاضي أن يزيد على هذا في التغليظ وينقص، وليس عندهم التغليظ بالزمان والمكان؛ لأن المقصود تعظيم المقسم به، وهو حاصل بدون ذلك. وفي إيجاب التغليظ حرج على القاضي. وهم مجمعون على أن من وجهت إليه اليمين لا يعتبر ناكلا إن أبى التغليظ(). \\n\\nالتحالف: \\n\\n27 - مصدر تحالف، ومن معانيه في اللغة: طلب كل من المتداعيين يمين الآخر. وهذا المعنى هو الموافق للشرع. غاية الأمر أن التحالف يكون أمام القضاء(). \\n\\nوالمراد هنا حلف المتخاصمين في مجلس القضاء. \\n\\nإذا اختلف البائع والمشتري في مقدار الثمن أو المبيع أو',
    'المحتاج شرح المنهاج»؛ و «الإيعاب شرح العباب المحيط بمعظم نصوص الشافعية والأصحاب»؛ و «الصواعق المحرقة في الرد على أهل البدع والزندقة»؛ و «إتحاف أهل الإسلام بخصوصيات الصيام». \\n\\n(البدر الطالع 1 \\\\ 109؛ ومعجم المؤلفين 2 \\\\ 152؛ والأعلام للزركلي 1 \\\\ 223) \\n\\nابن حزم (384 -456 ه) \\n\\nهو علي بن أحمد بن سعيد بن حزم الظاهري. أبو محمد. عالم الأندلس في عصره. أصله من الفرس. أول من أسلم من أسلافه جد له كان يدعى يزيد مولى ليزيد بن أبي سفيان . كانت لابن حزم الوزارة وتدبير المملكة، فانصرف عنها إلى التأليف والعلم. كان فقيها حافظا يستنبط الأحكام من الكتاب والسنة على طريقة أهل الظاهر، بعيدا عن',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000,  0.2793, -0.0995],
#         [ 0.2793,  1.0000, -0.1603],
#         [-0.0995, -0.1603,  1.0000]])

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.341
cosine_accuracy@3 0.5064
cosine_accuracy@5 0.5721
cosine_accuracy@10 0.6553
cosine_precision@1 0.341
cosine_precision@3 0.1688
cosine_precision@5 0.1144
cosine_precision@10 0.0655
cosine_recall@1 0.341
cosine_recall@3 0.5064
cosine_recall@5 0.5721
cosine_recall@10 0.6553
cosine_ndcg@10 0.4919
cosine_mrr@10 0.4404
cosine_map@100 0.4486

Information Retrieval

Metric Value
cosine_accuracy@1 0.2982
cosine_accuracy@3 0.4491
cosine_accuracy@5 0.5165
cosine_accuracy@10 0.6008
cosine_precision@1 0.2982
cosine_precision@3 0.1497
cosine_precision@5 0.1033
cosine_precision@10 0.0601
cosine_recall@1 0.2982
cosine_recall@3 0.4491
cosine_recall@5 0.5165
cosine_recall@10 0.6008
cosine_ndcg@10 0.4414
cosine_mrr@10 0.3913
cosine_map@100 0.4002

Training Details

Training Dataset

Unnamed Dataset

  • Size: 79,716 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 4 tokens
    • mean: 24.06 tokens
    • max: 58 tokens
    • min: 192 tokens
    • mean: 192.0 tokens
    • max: 192 tokens
  • Samples:
    anchor positive
    What are the differences in the rulings regarding the recitation of the verse "Sajdah" between different Islamic schools of thought? في القرآن الكريم أربع عشرة آية فيها السجود: في الأعراف، والرعد، والنحل، والإسراء، ومريم، والحج، وفيها سجدتان في بعض المذاهب، وفي الفرقان، والنمل، والسجدة الم تنزيل و ص وفصلت، والنجم، والانشقاق، واقرأ، وزاد بعضهم آخر \n\nالحجر، والسجود عند الجمهور بقراءة آيات السجدة مسنون، وواجب عند الحنفية(). \n\nوتفصيل مواضع السجود، وعلى من يجب، وشروط السجود، كل ذلك تفصيله في مصطلح (سجود التلاوة). \n\n\n\n\n\n\n \n\nتلبية \n\nالتعريف: \n\n1 - التلبية لغة: إجابة المنادي، وهي إما في الحج وإما في غيره كالوليمة والتلبية في غير الحج. \n\nوقد سبق الكلام عنها في مصطلح (إجابة) ج 1 ص 251 وأما في الحج فالمراد بها
    Who were some of the notable companions of Abu al-Sha'ra al-Darami mentioned in the text? ترجمته في ج 1 ص 337. \n\n\n\nأبو العشراء الدارمي (؟ -؟) \n\nقيل: اسمه يسار بن بكر بن مسعود بن خولي بن حرملة، أبو العشراء، الدارمي، التميمي. روى عن أبيه، وعنه حماد بن سلمة. وذكر أبو موسى المديني أنه وقع له من روايته عن النبي خمسة عشر حديثا. قال ابن حجر: وقفت على جمع حديثه وكلها بأسانيد مظلمة. ذكره ابن حبان في الثقات. وقال ابن سعد: هو مجهول. قال البخاري: في اسمه وحديثه وسماعه من أبيه نظر. \n\n(تهذيب التهذيب 12/167). \n\nأبو القاسم القشيري: ر: القشيري. \n\n\n\nأبو قتادة: هو الحارث بن ربعي: \n\nتقدمت ترجمته في ج 2 ص 404. \n\n\n\nأبو الليث السمرقندي: هو نصر بن محمد: \n\nتقدمت ترجمته في ج 1 ص
    What is the difference between using "أي" and "كل" or "كلما" in conditional statements regarding legal rulings? أن حكم (أي) في التعليق كحكم (متى ومن وكلما) \n\nبمعنى أنه لو علق التصرف بنفي فعل بأي، كما لو علق الطلاق على نفي الدخول بأي، بأن قال: أي وقت لم تدخلي فيه الدار فأنت طالق، فإنه إن مضى زمن يمكنها فيه الدخول - ولم تدخل - فإنه يقع الطلاق بعده على الفور. \n\nوأما لو علق الطلاق على إيجاد فعل بأي، فلا تفيد الفور كغيرها من أدوات التعليق(). \n\nوجاء في تبيين الحقائق أن (أي) لا تعم بعموم الصفة فلو قال: أي امرأة أتزوجها فهي طالق، فإن ذلك يتحقق في امرأة واحدة فقط. \n\nبخلاف كلمتي (كل وكلما) فإنهما تفيدان عموم ما دخلتا عليه كما سيأتي(). \n\nز - كل وكلما : \n\n17 - كلمة (كل) تستعمل بمعنى
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "MultipleNegativesRankingLoss",
        "matryoshka_dims": [
            1024,
            256
        ],
        "matryoshka_weights": [
            1,
            1
        ],
        "n_dims_per_step": -1
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 32
  • gradient_accumulation_steps: 4
  • learning_rate: 2e-05
  • num_train_epochs: 2
  • lr_scheduler_type: cosine
  • warmup_ratio: 0.1
  • bf16: True
  • tf32: True
  • load_best_model_at_end: True
  • gradient_checkpointing: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 64
  • per_device_eval_batch_size: 32
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 4
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 2
  • max_steps: -1
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: True
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: True
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss dim_1024_cosine_ndcg@10 dim_256_cosine_ndcg@10
0.0321 10 2.4674 - -
0.0642 20 2.2763 - -
0.0963 30 1.9145 - -
0.1284 40 1.6864 - -
0.1605 50 1.5235 0.4153 0.3539
0.1926 60 1.4239 - -
0.2247 70 1.3109 - -
0.2568 80 1.2667 - -
0.2889 90 1.2602 - -
0.3210 100 1.2305 0.4525 0.3919
0.3531 110 1.1687 - -
0.3852 120 1.147 - -
0.4173 130 1.0961 - -
0.4494 140 1.0522 - -
0.4815 150 1.0472 0.4714 0.4134
0.5136 160 1.0128 - -
0.5457 170 1.0101 - -
0.5778 180 1.0731 - -
0.6100 190 1.0003 - -
0.6421 200 1.0544 0.4748 0.4251
0.6742 210 0.9778 - -
0.7063 220 1.013 - -
0.7384 230 1.0015 - -
0.7705 240 0.9881 - -
0.8026 250 1.0132 0.4822 0.4296
0.8347 260 0.96 - -
0.8668 270 0.9993 - -
0.8989 280 1.0048 - -
0.9310 290 0.8957 - -
0.9631 300 0.9568 0.4858 0.4352
0.9952 310 0.9017 - -
1.0257 320 0.8178 - -
1.0578 330 0.7772 - -
1.0899 340 0.7431 - -
1.1220 350 0.8291 0.4897 0.4395
1.1541 360 0.7911 - -
1.1862 370 0.76 - -
1.2183 380 0.7424 - -
1.2504 390 0.7667 - -
1.2825 400 0.8333 0.4916 0.4401
1.3146 410 0.6788 - -
1.3467 420 0.7553 - -
1.3788 430 0.7871 - -
1.4109 440 0.7872 - -
1.4430 450 0.7906 0.4921 0.4411
1.4751 460 0.7503 - -
1.5072 470 0.7462 - -
1.5393 480 0.7318 - -
1.5714 490 0.7799 - -
1.6035 500 0.7838 0.4913 0.4410
1.6356 510 0.7711 - -
1.6677 520 0.7397 - -
1.6998 530 0.7849 - -
1.7319 540 0.8791 - -
1.7640 550 0.7549 0.4919 0.4409
1.7961 560 0.7487 - -
1.8283 570 0.7711 - -
1.8604 580 0.7262 - -
1.8925 590 0.7597 - -
1.9246 600 0.7358 0.4919 0.4414

Framework Versions

  • Python: 3.11.13
  • Sentence Transformers: 5.1.1
  • Transformers: 4.56.2
  • PyTorch: 2.8.0+cu128
  • Accelerate: 1.10.1
  • Datasets: 4.2.0
  • Tokenizers: 0.22.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}