Dansk Data Science Community

non-profit

https://ddsc.io/

Dansk-Data-Science-Community

Activity Feed Request to join this org

AI & ML interests

The purpose of Dansk Data Science Community (DDSC) is to organize open-source projects for the benefit of the Danish data science community.

Recent Activity

KennethEnevoldsen authored a paper 16 days ago

MAEB: Massive Audio Embedding Benchmark

KennethEnevoldsen published a dataset about 1 month ago

DDSC/partial-danish-gigaword-small-test-sample

ThatsGroes updated a dataset 3 months ago

DDSC/nordic-embedding-training-data

View all activity

KennethEnevoldsen

authored a paper 16 days ago

MAEB: Massive Audio Embedding Benchmark

Paper • 2602.16008 • Published 18 days ago • 21

KennethEnevoldsen

published a dataset about 1 month ago

DDSC/partial-danish-gigaword-small-test-sample

Viewer • Updated Jan 9, 2023 • 2.41k • 20

updated a dataset 3 months ago

DDSC/nordic-embedding-training-data

Viewer • Updated Dec 13, 2025 • 968k • 113 • 3

KennethEnevoldsen

authored a paper 5 months ago

HUME: Measuring the Human-Model Performance Gap in Text Embedding Task

Paper • 2510.10062 • Published Oct 11, 2025 • 10

KennethEnevoldsen

authored a paper 7 months ago

Dynaword: From One-shot to Continuously Developed Datasets

Paper • 2508.02271 • Published Aug 4, 2025 • 15

KennethEnevoldsen

authored a paper 11 months ago

MIEB: Massive Image Embedding Benchmark

Paper • 2504.10471 • Published Apr 14, 2025 • 21

jealk

updated a dataset 11 months ago

DDSC/nordic-embedding-training-data

Viewer • Updated Dec 13, 2025 • 968k • 113 • 3

jealk

published a dataset 11 months ago

DDSC/nordic-embedding-training-data

Viewer • Updated Dec 13, 2025 • 968k • 113 • 3

KennethEnevoldsen

authored 2 papers about 1 year ago

TextDescriptives: A Python package for calculating a large variety of metrics from text

Paper • 2301.02057 • Published Jan 5, 2023

MMTEB: Massive Multilingual Text Embedding Benchmark

Paper • 2502.13595 • Published Feb 19, 2025 • 45

updated a dataset about 1 year ago

DDSC/da-wikipedia-queries

Viewer • Updated Jan 10, 2025 • 90.8k • 34 • 5

KennethEnevoldsen

in DDSC/da-wikipedia-queries-gemma over 1 year ago

Librarian Bot: Add language metadata for dataset

#1 opened over 1 year ago by

updated 2 datasets over 1 year ago

DDSC/da-wikipedia-queries-gemma-processed

Viewer • Updated Nov 19, 2024 • 30.3k • 9 • 1

DDSC/da-wikipedia-queries-gemma

Viewer • Updated Dec 1, 2024 • 30.3k • 15

in DDSC/da-wikipedia-queries over 1 year ago

Update README.md

#3 opened over 1 year ago by

Librarian Bot: Add language metadata for dataset

#2 opened over 1 year ago by

KennethEnevoldsen

authored 4 papers over 1 year ago

Encoder vs Decoder: Comparative Analysis of Encoder and Decoder Language Models on Multilingual NLU Tasks

Paper • 2406.13469 • Published Jun 19, 2024

DaCy: A Unified Framework for Danish NLP

Paper • 2107.05295 • Published Jul 12, 2021

Danish Foundation Models

Paper • 2311.07264 • Published Nov 13, 2023

$S^3$ -- Semantic Signal Separation

Paper • 2406.09556 • Published Jun 13, 2024