Ver registro no DEDALUS
Exportar registro bibliográfico

Metrics


Metrics:

BSP cost and scalability analysis for MapReduce operations (2015)

  • Authors:
  • USP affiliated authors: SATO, LIRIA MATSUMOTO - EP
  • USP Schools: EP
  • DOI: 10.1002/cpe.3628
  • Subjects: ARQUITETURA E ORGANIZAÇÃO DE COMPUTADORES; ARQUIVOS DE COMPUTADOR
  • Language: Inglês
  • Imprenta:
  • Source:
  • Acesso online ao documento

    Online accessDOI or search this record in
    Informações sobre o DOI: 10.1002/cpe.3628 (Fonte: oaDOI API)
    • Este periódico é de assinatura
    • Este artigo NÃO é de acesso aberto
    • Cor do Acesso Aberto: closed

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SENGER, Hermes; MARIN, Mauricio; MARCONDES, Cesar Augusto Cavalheiro; et al. BSP cost and scalability analysis for MapReduce operations. Concurrency Computation: Practice and Experience[S.l.], Wiley, v. 28, p. 2503-2527, 2015. Disponível em: < https://doi.org/10.1002/cpe.3628 > DOI: 10.1002/cpe.3628.
    • APA

      Senger, H., Marin, M., Marcondes, C. A. C., Arantes, L., Costa, V. G., Silva, F. A. B. da, & Sato, L. M. (2015). BSP cost and scalability analysis for MapReduce operations. Concurrency Computation: Practice and Experience, 28, 2503-2527. doi:10.1002/cpe.3628
    • NLM

      Senger H, Marin M, Marcondes CAC, Arantes L, Costa VG, Silva FAB da, Sato LM. BSP cost and scalability analysis for MapReduce operations [Internet]. Concurrency Computation: Practice and Experience. 2015 ; 28 2503-2527.Available from: https://doi.org/10.1002/cpe.3628
    • Vancouver

      Senger H, Marin M, Marcondes CAC, Arantes L, Costa VG, Silva FAB da, Sato LM. BSP cost and scalability analysis for MapReduce operations [Internet]. Concurrency Computation: Practice and Experience. 2015 ; 28 2503-2527.Available from: https://doi.org/10.1002/cpe.3628

    Referências citadas na obra
    Idc In The Digital Universe in 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East 2012 http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf
    Hey AJ Tansley S Tolle KM The fourth paradigm: data-intensive scientific discovery 2009
    Autor: Kell
    Título: Here is the evidence, now what is the hypothesis? The complementary roles of inductive and hypothesis-driven science in the post-genomic era
    Título do periódico: Bioessays
    Volume: 26
    Fascículo: 1
    Primeira página: 99
    Ano: 2004
    DOI: 10.1002/bies.10385
    Autor: Chin
    Título: Cancer genomics: from discovery science to personalized medicine
    Título do periódico: Nature Medicine
    Volume: 17
    Fascículo: 3
    Primeira página: 297
    Ano: 2011
    DOI: 10.1038/nm.2323
    Autor: O'Driscoll
    Título: ‘Big Data’, Hadoop and cloud computing in genomics
    Título do periódico: Journal of Biomedical Informatics
    Volume: 46
    Fascículo: 5
    Primeira página: 774
    Ano: 2013
    DOI: 10.1016/j.jbi.2013.07.001
    Dean J Ghemawat S Mapreduce: Simplifed data processing on large clusters 6th Symposium on Operating Systems Design and Implementation (OSDI) USENIX San Francisco, CA 2004 1 13
    Apache In Hadoop website 2010 http://hadoop.apache.org/
    Autor: Venner
    Ano: 2009
    Autor: White
    Ano: 2012
    Google Appengine In Google App Engine API for running MapReduce jobs 2013 http://code.google.com/p/appengine-mapreduce/
    EC2 Amazon In Amazon Elastic MapReduce 2013 http://aws.amazon.com/elasticmapreduce/
    Autor: Dean
    Título: MapReduce: simplified data processing on large clusters
    Título do periódico: Communications of the ACM
    Volume: 51
    Primeira página: 107
    Ano: 2008
    DOI: 10.1145/1327452.1327492
    Facebook In Facebook has the world's largest Hadoop cluster! 2008 http://hadoopblog.blogspot. com/2010/05/\\facebook-has-worlds-largest-hadoop.html
    Autor: Valiant
    Título: A bridging model for parallel computation
    Título do periódico: Communications of the ACM
    Volume: 33
    Fascículo: 8
    Primeira página: 103
    Ano: 1990
    DOI: 10.1145/79173.79181
    Autor: Abouzeid
    Título: An architectural hybrid of MapReduce and DBMS technologies for analytical workloads
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 2
    Fascículo: 1
    Primeira página: 922
    Ano: 2009
    DOI: 10.14778/1687627.1687731
    Autor: Chaiken
    Título: Easy and efficient parallel processing of massive data sets
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 1
    Fascículo: 2
    Primeira página: 1265
    Ano: 2008
    DOI: 10.14778/1454159.1454166
    Autor: Doulkeridis
    Título: A survey of large-scale analytical query processing in MapReduce
    Título do periódico: The VLDB Journal
    Volume: 23
    Fascículo: 3
    Primeira página: 355
    Ano: 2014
    DOI: 10.1007/s00778-013-0319-9
    Autor: Sakr
    Título: The family of MapReduce and large-scale data processing systems
    Título do periódico: ACM Computing Surveys
    Volume: 46
    Fascículo: 1
    Primeira página: 11:1
    Ano: 2013
    DOI: 10.1145/2522968.2522979
    Autor: Dittrich
    Título: Hadoop++: Making a yellow elephant run like a cheetah (without it even noticing)
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 3
    Fascículo: 1-2
    Primeira página: 515
    Ano: 2010
    DOI: 10.14778/1920841.1920908
    Autor: Dittrich
    Título: Only aggressive elephants are fast elephants
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 5
    Fascículo: 11
    Primeira página: 1591
    Ano: 2012
    DOI: 10.14778/2350229.2350272
    Autor: Nykiel
    Título: Sharing across multiple queries in MapReduce
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 3
    Fascículo: 1-2
    Primeira página: 494
    Ano: 2010
    DOI: 10.14778/1920841.1920906
    Elghandour I Restore AA Reusing results of MapReduce jobs in PIG Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data Scottsdale, Arizona, USA 2012 701 704
    Autor: Jahani
    Título: Automatic optimization for MapReduce programs
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 4
    Fascículo: 6
    Primeira página: 385
    Ano: 2011
    DOI: 10.14778/1978665.1978670
    Cafarella MJ Ré C Manimal: Relational optimization for data-intensive programs Proceedings of the 13th International Workshop on the Web and Databases Indianapolis, Indiana, USA 2010 10:1 10:6
    Autor: Herodotou
    Título: Profiling, what-if analysis, and cost-based optimization of MapReduce programs
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 4
    Fascículo: 11
    Primeira página: 1111
    Ano: 2011
    Ekanayake J Li H Zhang B Gunarathne T Bae S-H Qiu J Fox G Twister: a runtime for iterative MapReduce Proceedings of the 19th ACM International Symposium on High Performance Distributed Computing ACM Chicago, Illinois, USA 2010 810 818
    Gufler B Augsten N Reiser A Kemper A Load balancing in MapReduce based on scalable cardinality estimates Proceedings of the 2012 IEEE 28th International Conference on Data Engineering Washington, DC, USA 2012 522 533
    Le Y Liu J Ergün F Wang D Online load balancing for MapReduce with skewed data input 2014 IEEE Conference on Computer Communications, INFOCOM 2014 Toronto, Canada 2014 2004 2012
    Autor: Englert
    Título: Worst case and probabilistic analysis of the 2-opt algorithm for the TSP
    Título do periódico: Algorithmica
    Volume: 68
    Fascículo: 1
    Primeira página: 190
    Ano: 2014
    DOI: 10.1007/s00453-013-9801-4
    Kolb L Thor A Rahm E Load balancing for MapReduce-based entity resolution Proceedings of the 2012 IEEE 28th International Conference on Data Engineering 2012 618 629
    Kwon Y Balazinska M Howe B Skewtune JR Mitigating skew in MapReduce applications Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data 2012 25 36
    Autor: Mohamed
    Título: Mro-mpi: MapReduce overlapping using MPI and an optimized data exchange policy
    Título do periódico: Parallel Computing
    Volume: 39
    Fascículo: 12
    Primeira página: 851
    Ano: 2013
    DOI: 10.1016/j.parco.2013.08.010
    Autor: Mohamed
    Título: Distributed media indexing based on MPI and MapReduce
    Título do periódico: Multimedia Tools and Applications
    Volume: 69
    Fascículo: 2
    Primeira página: 513
    Ano: 2014
    DOI: 10.1007/s11042-012-1283-x
    Autor: McCreadie
    Título: MapReduce indexing strategies: studying scalability and efficiency
    Título do periódico: Information Processing & Management
    Volume: 48
    Fascículo: 5
    Primeira página: 873
    Ano: 2012
    DOI: 10.1016/j.ipm.2010.12.003
    Ounis I Amati G Plachouras V He B Macdonald C Terrier CL A high performance and scalable information retrieval platform Proceedings of ACM SIGIR'06 Workshop on Open Source Information Retrieval (OSIR 2006) 2006 18 25
    McCreadie RMC Macdonald C Ounis I On single-pass indexing with MapReduce Proceedings of the 32Nd International ACM SIGIR Conference on Research and Development in Information Retrieval Boston, Massachusetts, USA 2009 742 743
    Autor: Heinz
    Título: Efficient single-pass index construction for text databases
    Título do periódico: Journal of the American Society for Information Science and Technology
    Volume: 54
    Fascículo: 8
    Primeira página: 713
    Ano: 2003
    DOI: 10.1002/asi.10268
    Akritidis L Bozanis P Computing scientometrics in large-scale academic search engines with MapReduce Proceedings of the 13th International Conference on Web Information Systems Engineering Paphos, Cyprus 2012 609 623
    Autor: Jiang
    Título: The performance of MapReduce: an in-depth study
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 3
    Fascículo: 1-2
    Primeira página: 472
    Ano: 2010
    DOI: 10.14778/1920841.1920903
    Dede E Govindaraju M Gunter D Canon RS Ramakrishnan L Performance evaluation of a MongoDB and Hadoop platform for scientific data analysis Proceedings of the 4th ACM Workshop on Scientific Cloud Computing New York City, NY, USA 2013 13 20
    Autor: Gunther
    Título: Hadoop superlinear scalability
    Título do periódico: Communications of the ACM
    Volume: 58
    Fascículo: 4
    Primeira página: 46
    Ano: 2015
    DOI: 10.1145/2719919
    Autor: Silva
    Título: Improving scalability of Bag-of-Tasks applications running on master-slave platforms
    Título do periódico: Parallel Computing
    Volume: 35
    Fascículo: 2
    Primeira página: 57
    Ano: 2009
    DOI: 10.1016/j.parco.2008.09.013
    Autor: Senger
    Título: Bounds on the scalability of Bag-of-Tasks applications running on master-slave platforms
    Título do periódico: Parallel Processing Letters
    Volume: 22
    Fascículo: 02
    Ano: 2012
    DOI: 10.1142/S0129626412500041
    Senger H Hruschka ER Silva FAB Sato LM Bianchini CP Esperidião MD Esperidião MD Inhambu: data mining using idle cycles in clusters of PCs Network and Parallel Computing Springer Wuhan, China 2004 213 220
    Autor: Silva
    Título: Scalability limits of Bag-of-Tasks applications running on hierarchical platforms
    Título do periódico: Journal of Parallel and Distributed Computing
    Volume: 71
    Fascículo: 6
    Primeira página: 788
    Ano: 2011
    DOI: 10.1016/j.jpdc.2011.01.002
    Fortune S Wyllie J Parallelism in random access machines Proceedings of the Tenth Annual ACM Symposium on Theory of Computing ACM Atlanta, Georgia, USA 1978 114 118
    Autor: Tiskin
    Primeira página: 192
    Ano: 2011
    Dehne F Fabri A Rau-Chaplin A Scalable parallel geometric algorithms for coarse grained multicomputers Proceedings of the Ninth Annual Symposium on Computational Geometry San Diego, CA, USA 1993 298 307
    Autor: Feldman
    Título: On distributing symmetric streaming computations
    Título do periódico: ACM Transactions on Algorithms (TALG)
    Volume: 6
    Fascículo: 4
    Primeira página: 66
    Ano: 2010
    Karloff H Suri S Vassilvitskii S A model of computation for MapReduce Proceedings of the Twenty-First Annual ACM-SIAM Symposium on Discrete Algorithms Society for Industrial and Applied Mathematics Austin, Texas, USA 2010 938 948
    Goodrich MT Sitchinava N Zhang Q Sorting, searching, and simulation in the MapReduce framework Proceedings of the 22nd International Conference on Algorithms and Computation Springer-Verlag Taipei, Taiwan 2011 374 383
    Fegaras L Supporting bulk synchronous parallelism in MapReduce queries High Performance Computing, Networking, Storage and Analysis (SCC), 2012 SC Companion:, 2012 1068 1077
    HAMA: http://incubator.apache.org/hama/
    Seo S Yoon E Kim J Jin S Kim J-S Hama SM An efficient matrix computation with the MapReduce framework 2010 IEEE Second International Conference on Cloud Computing Technology and Science (CloudCom) Indianapolis, USA 2010 721 726
    Malewicz G Austern MH Bik AJC Dehnert JC Horn I Leiser N Czajkowski G Pregel: A system for large-scale graph processing Proceedings of the 2010 ACM SIGMOD International Conference on Management of Data Indianapolis, Indiana, USA 2010 135 146
    Apache Giraph Giraph 2015 http://incubator.apache.org/giraph/
    Autor: Matthew
    Título: {BSP} vs mapreduce
    Título do periódico: Procedia Computer Science
    Volume: 9
    Fascículo: 0
    Primeira página: 246
    Ano: 2012
    Okcan A Riedewald M Anti-combining for MapReduce International Conference on Management of Data, SIGMOD 2014 Snowbird, UT, USA 2014 839 850
    Lin Y Agrawal D Chen C Ooi BC Llama SW Leveraging columnar storage for scalable join processing in the MapReduce framework Proceedings of the 2011 ACM SIGMOD International Conference on Management of Data Athens, Greece 2011 961 972
    Autor: Zhang
    Título: Efficient multi-way theta-join processing using MapReduce
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 5
    Fascículo: 11
    Primeira página: 1184
    Ano: 2012
    DOI: 10.14778/2350229.2350238
    Suri S Vassilvitskii S Counting triangles and the curse of the last reducer Proceedings of the 20th International Conference on World Wide Web 2011 607 614
    Tsourakakis CE Kang U Miller GL Doulion CF Counting triangles in massive graphs with a coin Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining Paris, France 2009 837 846
    Appel1 AP Hruschka ERJ Centaurs-a component based framework to mine large graphs Proceedings of the Brazilian Symposium on Databases - SBBD Brazilian Computer Society Belo Horizonte, MG, Brazil 2010
    Autor: Panda
    Título: Planet: Massively parallel learning of tree ensembles with MapReduce
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 2
    Fascículo: 2
    Primeira página: 1426
    Ano: 2009
    DOI: 10.14778/1687553.1687569
    Autor: Laptev
    Título: Early accurate results for advanced analytics on MapReduce
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 5
    Fascículo: 10
    Primeira página: 1028
    Ano: 2012
    DOI: 10.14778/2336664.2336675
    Chierichetti F Kumar R Tomkins A Max-cover in MapReduce Proceedings of the 19th International Conference on World Wide Web Raleigh, North Carolina USA 2010 231 240
    Autor: Jestes
    Título: Building wavelet histograms on large data in MapReduce
    Título do periódico: Proceedings of the VLDB Endowment
    Volume: 5
    Fascículo: 2
    Primeira página: 109
    Ano: 2011
    DOI: 10.14778/2078324.2078327
    Autor: Kitsos
    Título: Scalable entity-based summarization of web search results using MapReduce
    Título do periódico: Distrib. Parallel Databases
    Volume: 32
    Fascículo: 3
    Primeira página: 405
    Ano: 2014
    DOI: 10.1007/s10619-013-7133-7
    Autor: Grama
    Ano: 2003
    Autor: Kumar
    Título: Parallel depth first search. Part II. Analysis
    Título do periódico: International Journal of Parallel Programming
    Volume: 16
    Fascículo: 6
    Primeira página: 501
    Ano: 1987
    DOI: 10.1007/BF01389001
    Schmidt R Pedone F Consistent main-memory database federations under deferred disk writes Proceeding of the 24th IEEE Symposium on Reliable Distributed Systems Orlando, FL, US 2005
    Autor: Adam
    Título: The pathologies of big data
    Título do periódico: Communications of the ACM
    Volume: 52
    Fascículo: 8
    Primeira página: 36
    Ano: 2009
    DOI: 10.1145/1536616.1536632
    Autor: Lin
    Título: Data-intensive text processing with MapReduce
    Título do periódico: Synthesis Lectures on Human Language Technologies
    Volume: 3
    Fascículo: 1
    Primeira página: 1
    Ano: 2010
    DOI: 10.2200/S00274ED1V01Y201006HLT007
    Afrati FN Sarma AD Salihoglu S Ullman JD Vision paper: towards an understanding of the limits of MapReduce computation 2012
    Autor: Barroso
    Ano: 2009
    Autor: Benson
    Título: Understanding data center traffic characteristics
    Título do periódico: ACM SIGCOMM Computer Communication Review
    Volume: 40
    Fascículo: 1
    Primeira página: 92
    Ano: 2010
    DOI: 10.1145/1672308.1672325
    Greenberg A Lahiri P Maltz DA Patel P Sengupta S Towards a next generation data center architecture: scalability and commoditization Proceedings of the ACM Workshop on Programmable Routers for Extensible Services of Tomorrow ACM Seattle, WA, USA 2008 57 62
    Autor: Kurose
    Ano: 2013
    Martins J Ahmed M Raiciu C Olteanu V Honda M Bifulco R Huici F Clickos and the art of network function virtualization 11th USENIX Symposium on Networked Systems Design and Implementation (NSDI 14) USENIX Association Seattle, WA 2014 459 473
    Clarke CL Craswell N Soboroff I Overview of the TREC 2009 web track Waterloo, Canada 2009
    Autor: Kolberg
    Título: MRSG-a MapReduce simulator over simgrid
    Título do periódico: Parallel Computing
    Volume: 39
    Fascículo: 4
    Primeira página: 233
    Ano: 2013
    DOI: 10.1016/j.parco.2013.02.001
    Autor: Casanova
    Título: Versatile, scalable, and accurate simulation of distributed applications and platforms
    Título do periódico: Journal of Parallel and Distributed Computing
    Volume: 74
    Fascículo: 10
    Primeira página: 2899
    Ano: 2014
    DOI: 10.1016/j.jpdc.2014.06.008
    Elteir M Lin H Feng W Enhancing MapReduce via asynchronous data processing 2010 IEEE 16th International Conference on Parallel and Distributed Systems (ICPADS) IEEE Shanghai, China 2010 397 405
    Condie T Conway N Alvaro P Hellerstein JM Gerth J Talbot J Elmeleegy K Sears R Online aggregation and continuous query support in MapReduce Proceedings of the 2010 ACM SIGMOD International Conference on Management of data ACM Indianapolis, Indiana, USA 2010 1115 1118