--- license: openrail language: - de metrics: - f1 - accuracy - precision - recall pipeline_tag: token-classification tags: - recipe - cooking - entity_recognition widget: - text: '500 g Pellkartoffeln, mehlig, gekocht, 375 g Quark (Magerstufe), 150 g Mehl, 65 g Zucker, 1 Prise(n) Salz, 1 Ei(er), Öl, z.B. Sonnenblumenöl zum Braten, Mehl, zum Bestäuben, Apfelmus, Zucker, zum Bestreuen Pellkartoffeln pellen und mit einer Kartoffelpresse zerdrücken. Quark, Mehl, Zucker, Salz und Ei zufügen. Alles zusammen zu einem geschmeidigen Teig verarbeiten. Der Teig darf nicht zu feucht sein und an den Händen kleben bleiben, sonst noch etwas Mehl zufügen. Der Teig darf aber auch nicht zu fest sein, er muß locker bleiben. Vom Teig werden dann handtellergroße, flache, ovale Quarkkeulchen geformt, die vorerst auf einem mit Mehl bestreutem Brett abgelegt werden. Die obere Seite der Quarkkeulchen wird noch mit etwas Mehl bestäubt. Die Quarkkeulchen im heißen Sonnenblumenöl von beiden Seiten goldbraun braten. Sie werden noch heiss mit Zucker bestreut oder mit viel Apfelmus bestrichen gegessen.' --- Weakly supervised token classification model for German recipe texts based on bert-base-german-cased. Code available: https://github.com/chefkoch24/weak-ingredient-recognition Dataset: https://www.kaggle.com/datasets/sterby/german-recipes-dataset Recognizes the following entities:
'O': 0,
'B-INGREDIENT': 1,
'I-INGREDIENT': 2,
'B-UNIT': 3,
'I-UNIT': 4,
'B-QUANTITY': 5,
'I-QUANTITY': 6
**Training:**
epochs: 2
optimizer: Adam
learning rate: 2e-5
max length: 512
recipes: 7801
The model was trained on single Geforce RTX2080 with 11GB GPU **Metrics on test set (weakly supervised):**
accuracy_token 0.9965656995773315
f1_token 0.9965656995773315
precision_token 0.9965656995773315
recall_token 0.9965656995773315