liu.seSearch for publications in DiVA
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Fördomsfulla associationer i en svenskvektorbaserad semantisk modell
Linköpings universitet, Institutionen för datavetenskap.
2019 (svensk)Independent thesis Basic level (degree of Bachelor), 12 hpOppgaveAlternativ tittel
Bias in a Swedish Word Embedding (engelsk)
Abstract [sv]

Semantiska vektormodeller är en kraftfull teknik där ords mening kan representeras av vektorervilka består av siffror. Vektorerna tillåter geometriska operationer vilka fångar semantiskt viktigaförhållanden mellan orden de representerar. I denna studie implementeras och appliceras WEAT-metoden för att undersöka om statistiska förhållanden mellan ord som kan uppfattas somfördomsfulla existerar i en svensk semantisk vektormodell av en svensk nyhetstidning. Resultatetpekar på att ordförhållanden i vektormodellen har förmågan att återspegla flera av de sedantidigare IAT-dokumenterade fördomar som undersöktes. I studien implementeras och applicerasockså WEFAT-metoden för att undersöka vektormodellens förmåga att representera två faktiskastatistiska samband i verkligheten, vilket görs framgångsrikt i båda undersökningarna. Resultatenav studien som helhet ger stöd till metoderna som används och belyser samtidigt problematik medatt använda semantiska vektormodeller i språkteknologiska applikationer.

Abstract [en]

Word embeddings are a powerful technique where word meaning can be represented by vectors containing actual numbers. The vectors allow  geometric operations that capture semantically important relationships between the words. In this study WEAT is applied in order to examine whether statistical properties of words pertaining to bias can be found in a swedish word embedding trained on a corpus from a swedish newspaper. The results shows that the word embedding can represent several of the IAT documented biases that where tested. A second method, WEFAT, is applied to the word embedding in order to explore the embeddings ability to represent actual statistical properties, which is also done successfully. The results from this study lends support to the validity of both methods aswell as illuminating the issue of problematic relationships between words in word embeddings.

sted, utgiver, år, opplag, sider
2019. , s. 40
HSV kategori
Identifikatorer
URN: urn:nbn:se:liu:diva-159027ISRN: LIU-IDA/KOGVET-G--19/017--SEOAI: oai:DiVA.org:liu-159027DiVA, id: diva2:1338076
Fag / kurs
Cognitive science
Veileder
Examiner
Tilgjengelig fra: 2019-08-13 Laget: 2019-07-19 Sist oppdatert: 2019-08-13bibliografisk kontrollert

Open Access i DiVA

micjo469_FördomsfullaAssociationer2019(698 kB)5 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 698 kBChecksum SHA-512
3e5702d4248af620d7e8b347e6871019cd5b06859986b4e7c99b321cd2b81060f7996fa3090d8f24fbfb78c37f468e2446807c0f2c92cdd97cd5073e3597703b
Type fulltextMimetype application/pdf

Søk i DiVA

Av forfatter/redaktør
Jonasson, Michael
Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 5 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 28 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf