liu.seSearch for publications in DiVA
Change search
ReferencesLink to record
Permanent link

Direct link
Evaluation of the Configurable Architecture REPLICA with Emulated Shared Memory
Linköping University, Department of Computer and Information Science, Software and Systems. Linköping University, The Institute of Technology.
2014 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Utvärdering av den konfigurerbara arkitekturen REPLICA med emulerat delat minne (Swedish)
Abstract [en]

REPLICA is a family of novel scalable chip multiprocessors with configurable emulated shared memory architecture, whose computation model is based on the PRAM (Parallel Random Access Machine) model.

The purpose of this thesis is to, by benchmarking different types of computation problems on REPLICA, similar parallel architectures (SB-PRAM and XMT) and more diverse ones (Xeon X5660 and Tesla M2050), evaluate how REPLICA is positioned among other existing architectures, both in performance and programming effort. But it should also examine if REPLICA is more suited for any special kinds of computational problems.

By using some of the well known Berkeley dwarfs, and input from unbiased sources, such as The University of Florida Sparse Matrix Collection and Rodinia benchmark suite, we have made sure that the benchmarks measure relevant computation problems.

We show that today’s parallel architectures have some performance issues for applications with irregular memory access patterns, which the REPLICA architecture can solve. For example, REPLICA only need to be clocked with a few MHz to match both Xeon X5660 and Tesla M2050 for the irregular memory access benchmark breadth first search. By comparing the efficiency of REPLICA to a CPU (Xeon X5660), we show that it is easier to program REPLICA efficiently than today’s multiprocessors.

Abstract [sv]

REPLICA är en grupp av konfigurerbara multiprocessorer som med hjälp utav ett emulerat delat minne realiserar PRAM modellen.

Syftet med denna avhandling är att genom benchmarking av olika beräkningsproblem på REPLICA, liknande (SB-PRAM och XMT) och mindre lika (Xeon X5660 och Tesla M2050) parallella arkitekturer, utvärdera hur REPLICA står sig mot andra befintliga arkitekturer. Både prestandamässigt och hur enkel arkitekturen är att programmera effektiv, men även försöka ta reda på om REPLICA är speciellt lämpad för några särskilda typer av beräkningsproblem.

Genom att använda välkända Berkeley dwarfs applikationer och opartisk indata från bland annat The University of Florida Sparse Matrix Collection och Rodinia benchmark suite, säkerställer vi att det är relevanta beräkningsproblem som utförs och mäts.

Vi visar att dagens parallella arkitekturer har problem med prestandan för applikationer med oregelbundna minnesaccessmönster, vilken REPLICA arkitekturen kan vara en lösning på. Till exempel, så behöver REPLICA endast vara klockad med några få MHz för att matcha både Xeon X5660 och Tesla M2050 för algoritmen breadth first search, vilken lider av just oregelbunden minnesåtkomst. Genom att jämföra effektiviteten för REPLICA gentemot en CPU (Xeon X5660), visar vi att det är lättare att programmera REPLICA effektivt än dagens multiprocessorer.

Place, publisher, year, edition, pages
2014. , 138 p.
Keyword [en]
REPLICA, PRAM, CRCW, Benchmark, Benchmarking, Parallel Computing, Manycore
Keyword [sv]
REPLICA, PRAM, CRCW, benchmark, benchmarking, Parallell Programmering
National Category
Computer Systems
URN: urn:nbn:se:liu:diva-104313ISRN: LIU-IDA/LITH-EX-A--14/010--SEOAI: diva2:697065
Subject / course
Computer and information science at the Institute of Technology
2014-02-06, John von Neumann, Linköping University, Campus Valla, Linköping, 13:15 (Swedish)
Available from: 2014-02-20 Created: 2014-02-14 Last updated: 2014-02-20Bibliographically approved

Open Access in DiVA

fulltext(2786 kB)264 downloads
File information
File name FULLTEXT01.pdfFile size 2786 kBChecksum SHA-512
Type fulltextMimetype application/pdf

Search in DiVA

By author/editor
Alnervik, Erik
By organisation
Software and SystemsThe Institute of Technology
Computer Systems

Search outside of DiVA

GoogleGoogle Scholar
Total: 264 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 345 hits
ReferencesLink to record
Permanent link

Direct link