liu.seSearch for publications in DiVA
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Utvärdering av Random Indexing och PageRank som verktyg för automatisk textsammanfattning
Linköping University, Department of Computer and Information Science.
2009 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesis
Abstract [sv]

Mängden information på internet är enorm och bara forsätter att öka på både gott och ont. Framförallt kan det vara svårt för grupper såsom synskadade och personer med språksvårigheter att navigera sig och ta vara på all denna information. Därmed finns ett behov av väl fungerande sammanfattningsverktyg för dessa, men även för andra människor som snabbt behöver presenteras det viktigaste ur en uppsättning texter. Den här studien undersöker hur väl sammanfattningssystemet CogSum, som är baserat på Random Indexing, presterar med och utan rankningsalgoritmen PageRank aktiverat på nyhetstexter och texter från Försäkringskassan. Utöver detta används sammanfattningssystemet SweSum som en baslinje i undersökningen. Rapporten innefattar en teoretisk bakgrund som avhandlar automatisk textsammanfattning i stort vilket inkluderar olika utvärderingsmetoder, tekniker och sammanfattningssystem. Utvärderingen utfördes med hjälp av det automatiska utvärderingsverktyget KTHxc på nyhetstexterna och ett annat sådant, AutoSummENG, på Försäkringskassans texter. Studiens resultat påvisar att CogSum utan PageRank presterar bättre än CogSum med PageRank på 10 nyhetstexter medan det omvända gäller för 5 texter från Försäkringskassan. SweSum i sin tur erhöll det bästa resultatet för nyhetstexterna respektive det sämsta för texterna från Försäkringskassan.

Place, publisher, year, edition, pages
2009. , 32 p.
Keyword [sv]
Automatisk textsammanfattning, Random Indexing, PageRank
National Category
Human Computer Interaction
Identifiers
URN: urn:nbn:se:liu:diva-53590ISRN: LIU-IDA-KOGVET-G--09/006--SEOAI: oai:DiVA.org:liu-53590DiVA: diva2:289966
Presentation
2009-06-11, Grace Hopper, Linköpings Universitet, Universitetsvägen 583 30, Linköping, 08:00 (Swedish)
Uppsok
Social and Behavioural Science, Law
Supervisors
Examiners
Available from: 2010-02-04 Created: 2010-01-25 Last updated: 2010-03-30Bibliographically approved

Open Access in DiVA

fulltext(890 kB)264 downloads
File information
File name FULLTEXT01.pdfFile size 890 kBChecksum SHA-512
835ea78f01fd2dc8b0b4755a9d0b017f8fc0da242b5882982d83514ccb0397b33e2a856219eeb63afa7691629d180140f2bc012411f51144564b97b0de675bdb
Type fulltextMimetype application/pdf

Search in DiVA

By author/editor
Gustavsson, Pär
By organisation
Department of Computer and Information Science
Human Computer Interaction

Search outside of DiVA

GoogleGoogle Scholar
Total: 264 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 158 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf