Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • harvard-cite-them-right
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Accelerating Text Mining Workloads in a MapReduce-based Distributed GPU Environment
Högskolan i Borås, Institutionen Biblioteks- och informationsvetenskap / Bibliotekshögskolan.
Högskolan i Borås, Institutionen Biblioteks- och informationsvetenskap / Bibliotekshögskolan.
2013 (Engelska)Ingår i: Journal of Parallel and Distributed Computing, ISSN 0743-7315, E-ISSN 1096-0848, Vol. 73, nr 2, s. 198-206Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

Scientific computations have been using GPU-enabled computers successfully, often relying on distributed nodes to overcome the limitations of device memory. Only a handful of text mining applications benefit from such infrastructure. Since the initial steps of text mining are typically data intensive, and the ease of deployment of algorithms is an important factor in developing advanced applications, we introduce a flexible, distributed, MapReduce-based text mining workflow that performs I/O-bound operations on CPUs with industry-standard tools and then runs compute-bound operations on GPUs which are optimized to ensure coalesced memory access and effective use of shared memory. We have performed extensive tests of our algorithms on a cluster of eight nodes with two NVidia Tesla M2050s attached to each, and we achieve considerable speedups for random projection and self-organizing maps.

Ort, förlag, år, upplaga, sidor
Elsevier Inc , 2013. Vol. 73, nr 2, s. 198-206
Nyckelord [en]
GPU computing, MapReduce, Text mining, Self-organizing maps, Random projection, Library and Information Science
Nationell ämneskategori
Data- och informationsvetenskap
Forskningsämne
Biblioteks- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:hb:diva-1419DOI: 10.1016/j.jpdc.2012.10.001ISI: 000314139800008Lokalt ID: 2320/11734OAI: oai:DiVA.org:hb-1419DiVA, id: diva2:869474
Tillgänglig från: 2015-11-13 Skapad: 2015-11-13 Senast uppdaterad: 2018-01-10

Open Access i DiVA

fulltext(387 kB)2412 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 387 kBChecksumma SHA-512
b03f117b6283b601ea5814b1137fc61e3d49a2be50142ae455b331965cbd27ea6d8d90a3d20a63f29572db7f5c5c50bba0b738baf69eb715b1ddbf7bc2c82450
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltext

Person

Wittek, PeterDarányi, Sándor

Sök vidare i DiVA

Av författaren/redaktören
Wittek, PeterDarányi, Sándor
Av organisationen
Institutionen Biblioteks- och informationsvetenskap / Bibliotekshögskolan
I samma tidskrift
Journal of Parallel and Distributed Computing
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 2412 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 893 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • harvard-cite-them-right
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf