liu.seSök publikationer i DiVA
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
An Aligned Resource of Swedish Complex-Simple Sentence Pairs
Linköpings universitet, Institutionen för datavetenskap, Interaktiva och kognitiva system. Linköpings universitet, Tekniska fakulteten.ORCID-id: 0000-0002-0932-7048
2018 (Engelska)Ingår i: Proceedings of the Seventh Swedish Language Technology Conference (SLTC), 2018Konferensbidrag, Publicerat paper (Övrigt vetenskapligt)
Abstract [en]

We present a method for aligning comparable corpora of simple-complex articles at the sentence level. Three methods were tested; Average Alignment (AA), Maximum Alignment (MA), and Hungarian Alignment (HA). For evaluating the algorithms, and finding the optimal combination of parameters, a dataset of manually annotated sentences was constructed. The algorithms were evaluated against the manually annotated dataset, and the best-performing algorithm proved to be the MA algorithm, which resulted in corpus comprising 59,513 aligned sentence pairs, of which 17,653 were unique sentences.

Ort, förlag, år, upplaga, sidor
2018.
Nationell ämneskategori
Språkbehandling och datorlingvistik
Identifikatorer
URN: urn:nbn:se:liu:diva-169794OAI: oai:DiVA.org:liu-169794DiVA, id: diva2:1468938
Konferens
The Seventh Swedish Language Technology Conference (SLTC-18), Stockholm, Sweden, 7-9 November 2018
Tillgänglig från: 2020-09-18 Skapad: 2020-09-18 Senast uppdaterad: 2025-02-07

Open Access i DiVA

Fulltext saknas i DiVA

Person

Rennes, Evelina

Sök vidare i DiVA

Av författaren/redaktören
Rennes, Evelina
Av organisationen
Interaktiva och kognitiva systemTekniska fakulteten
Språkbehandling och datorlingvistik

Sök vidare utanför DiVA

GoogleGoogle Scholar

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 58 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf