Interactive Labeling of Scan Segmentations
Interactive Labeling of Scan Segmentations
Bachelor's or Master's Thesis with the goal to design and develop an interactive labelling system for segmentation of advertisements from scanned newspaper archives.
WHO CAN APPLY? Only enrolled students from KIT (Karlsruher Institut für Technologie) with course of studies Wirtschaftsinformatik, Wirtschaftsingenieurwesen, Informationswirtschaft, or Technische Volkswirtschaftslehre.
Problem
As the digitization of the worlds libraries and print archives continues steadily, the demand for automated processing of such documents grows. Hereby, resarchers and practicioners would like to digitally process such documents with tools from computer vision (CV) and optical character recognition (OCR). Further they would like to search and filter for certain document meta-data. However, all of this presumes the availablity of such extracted features and meta-data. As state-of-the-art machine learning (ML) classifiers still do not reach desired accuracy levels, especially on old documents or those from fringe contexts, manual labeling effort is required.
Ohne Personalverantwortung
Bereiche
Requirements
We expect the student to be familiar with web development. The system should be devloped with a modern web application frontend framework (e.g. Vue with Vuetify) or be forked from an existing open source segmentation system. Further we expect the model to be trained based on standard Python frameworks. Experience in this regard is required as well.
Agiles Arbeiten
Regelmäßige Feedbackgespräche
Goals
For the scope of this thesis, we limit the context to segmenting advertisements from scanned pages of newspapers and magazines. This poses an interesting use-case for, for instance, advertising researchers. Associated colleagues at the University of Mannheim (UniMA) have already manually created a labeled set of 9000 segmented pages of the US magazine "The Economist", ranging from the 1840s to today. We expect a thesis student to develop an interactive labeling system in order to support the extension of this segmentation traing data-set to many more pages. Interactive labeling hereby strives to combine automatic steps (e.g. the trained model) with incremental user input. The work-packages entail:
- analyzing the state-of-the-art of such segmentation tools
- exchange with the researchers at UniMA that created the training data-set regarding requirements and system evaluation
- development of an interactive labeling system as part of a design science research process
- train a ML classifier based on the existing training data
- (potentially) include more training data from free data-sets
- develop an interactive labeling tool that integrates the ML classifier with manual segmentation
- include novel interaction paradigms with the existing ML classifier into the tool (manually reviewing those instances in which the model was uncertain, retraining the model based on new user input, ...)
- writing a thesis document according to research group requirements & participation in our thesis colloquium
Design science research is a well established methodology in the information systems field, which deals with the scientific view on artifacts, such as the labeling system that should be developed during this thesis. Hereby so called design knowledge can be derived from the development process and the finished artifact.
Sprachen
Kenntnisse und Fähigkeiten
Über ISSD - KIT
The research group “Information Systems & Service Design” (ISSD) headed by Prof. Mädche focuses in research, education, and innovation on designing interactive intelligent systems. The research belongs to the Institute of Information Systems and Marketing (IISM) and is embedded into the Information Systems & Engineering group. ISSD is also part of the Karlsruhe Service Research Institute (KSRI). The research group is positioned at the intersection of Information Systems (german: Wirtschaftsinformatik) and Human-Computer Interaction (HCI). Our mission is to create impactful scientific knowledge for designing interactive intelligent systems that enable humans to perform activities more efficiently, effectively, and meaningful. We believe that delivering cutting-edge knowledge and inspiring education, as well as an ongoing dialog with the public need to go hand in hand to maximize the impact of our work in organizations and society. The group is organized in three research departments: Digital Experience & Participation, Intelligent Enterprise Systems, and Digital Service Design & Innovation. Current topics of research are Human-AI Interaction, Cognitive Interaction Technologies, Physiological Computing Systems, Interactive Business Intelligence & Analytics Systems, and Interactive Systems Engineering.
Mit dem Laden der Karte werden Cookies gemäß unserer Datenschutzerklärung gesetzt. Mehr erfahren.
Häufige Fragen
Wer oder was ist Campusjäger by Workwise?
Campusjäger gehört zu Workwise – einer Jobplattform, die dich über den gesamten Karriereweg unterstützt. Wir übernehmen das Recruiting für verschiedene Unternehmen und begleiten dich im gesamten Bewerbungsprozess. Über Campusjäger by Workwise findest du Jobs für Studierende und Absolvent:innen. Deine Bewerbungen verwaltest du in deinem Workwise-Profil. Erfahre hier mehr über den Zusammenhang von Workwise und Campusjäger.
Ist der Job, den ich sehe, überhaupt noch verfügbar?
Bei Jobs, die noch zu besetzen sind, kannst du auf den Button 'Jetzt bewerben' klicken. Ist dies nicht möglich, wurde der Job bereits besetzt oder vorübergehend deaktiviert.
Welche Dokumente benötige ich für meine Bewerbung?
Für deine Bewerbung benötigst du folgende Dokumente:
- Immatrikulationsbescheinigung
Wo kann ich meine Dokumente hochladen?
Du wirst im Bewerbungsprozess nach den geforderten Bewerbungsunterlagen gefragt und kannst sie dort ganz einfach deiner Bewerbung hinzufügen. Wenn du deiner Bewerbung noch weitere Dokumente beifügen möchtest, kannst du diese in deinem Workwise-Profil hochladen. Sie stehen dann automatisch den Unternehmen, bei denen du dich beworben hast, zur Verfügung.
Wo finde ich weitere Informationen zum Unternehmen?
Im Unternehmensprofil von ISSD - KIT findest du weitere Informationen.
Kann ich meine Bewerbung nachträglich bearbeiten?
Ja, das ist möglich. In deiner Bewerbungsübersicht kannst du deine Angaben einsehen und Änderungen vornehmen. Bist du bereits zu einem Vorstellungsgespräch eingeladen, ist die Bearbeitung nicht mehr möglich. Du kannst aber weiterhin in deinem Workwise-Profil allgemeine Informationen ergänzen und weitere Dokumente hochladen.
Wie werden mir Neuigkeiten zu meiner Bewerbung mitgeteilt?
In deiner Bewerbungsübersicht bei Workwise hast du jederzeit einen Überblick über den Bewerbungsverlauf. Zusätzlich senden wir dir E-Mails zu den wichtigsten Statusänderungen.
Kann ich mich auch auf mehrere Jobs gleichzeitig bewerben?
Die Anzahl deiner Bewerbungen ist nicht limitiert. Einen Überblick über deine Bewerbungen findest du bei Workwise.
Können andere Unternehmen sehen, wo ich mich noch beworben habe?
Nein, Unternehmen können nur ihre eigens eingegangenen Bewerbungen sehen.
Kann ich den/die Ansprechpartner:in des Unternehmens direkt kontaktieren?
Eine persönliche Kontaktaufnahme ist über den Chat möglich, sobald du zu einem Vorstellungsgespräch eingeladen wurdest. Zuvor erhältst du alle wichtigen Statusänderungen per E-Mail. Bei Rückfragen kannst du dich an deine/n persönliche/n Candidate Manager:in von Workwise wenden.
Ich glaube, ich erfülle nicht alle Anforderungen. Kann ich mich trotzdem bewerben?
Auch wenn du nicht alle Anforderungen erfüllst, kannst du fehlende Kenntnisse durch weitere Fähigkeiten ausgleichen. Nutze die Bewerberfragen, um auf deine Motivation einzugehen und zeige dem Unternehmen, warum du dennoch auf den Job passt. Solltest du viele oder alle Anforderungen nicht erfüllen, wird die Bewerbung nicht erfolgreich sein.
What do I have to consider if I am not from Germany?
Please make sure to provide all necessary documents within your Workwise profile. It should include an EU work-permit (if you have no EU citizenship) and a CV at least. Depending on the position you are applying to, you could also be asked for a certificate of enrollment, a transcript of records or a language certificate. We would also recommend to inform yourself thoroughly in advance about visa regulations. Therefore you can use the official visa navigator from the Federal Foreign Office.
What do I have to consider if German is not my mother tongue?
Please take into account the job’s language requirements and make sure the requirements match your skills. In the job search you can use the language filter to find jobs without German language requirements. It is also helpful to provide language certificates. This section in our help center may support you during the application process.
Unser Jobangebot Interactive Labeling of Scan Segmentations klingt vielversprechend? Dann freuen wir uns auf deine Bewerbung.