VEM 2014 - Instituto de Computação
Transcrição
VEM 2014 - Instituto de Computação
Congresso Brasileiro de Software: Teoria e Prática 28 de setembro a 03 de outubro de 2014 – Maceió/AL II Workshop Brasileiro de Visualização, Evolução e Manutenção de Software VEM 2014 Anais VEM Volume 02 ISSN 2178-6097 Anais VEM 2014 II Workshop Brasileiro de Visualização, Evolução e Manutenção de Software COORDENADORES DO COMITÊ DE PROGRAMA Eduardo Figueiredo - Universidade Federal de Minas Gerais (UFMG) Renato Novais - Instituto Federal da Bahia (IFBA) COORDENAÇÃO DO CBSOFT 2014 Baldoino Fonseca - Universidade Federal de Alagoas (UFAL) Leandro Dias da Silva - Universidade Federal de Alagoas (UFAL) Márcio Ribeiro - Universidade Federal de Alagoas (UFAL) REALIZAÇÃO Universidade Federal de Alagoas (UFAL) Instituto de Computação (IC/UFAL) PROMOÇÃO Sociedade Brasileira de Computação (SBC) PATROCÍNIO CAPES, CNPq, INES, Google APOIO Instituto Federal de Alagoas, Aloo Telecom, Springer, Secretaria de Estado do Turismo AL, Maceió Convention & Visitors Bureau, Centro Universitário CESMAC e Mix Cópia 2 VEM PROCEEDINGS Volume 02 ISSN 2178-6097 VEM 2014 2nd Workshop on Software Visualization, Evolution and Maintenance PROGRAM CHAIRS Eduardo Figueiredo - Universidade Federal de Minas Gerais (UFMG) Renato Novais - Instituto Federal da Bahia (IFBA) CBSOFT 2014 GENERAL CHAIRS Baldoino Fonseca - Universidade Federal de Alagoas (UFAL) Leandro Dias da Silva - Universidade Federal de Alagoas (UFAL) Márcio Ribeiro - Universidade Federal de Alagoas (UFAL) ORGANIZATION Universidade Federal de Alagoas (UFAL) Instituto de Computação (IC/UFAL) PROMOTION Sociedade Brasileira de Computação (SBC) SPONSORS CAPES, CNPq, INES, Google SUPPORT Instituto Federal de Alagoas, Aloo Telecom, Springer, Secretaria de Estado do Turismo AL, Maceió Convention & Visitors Bureau, Centro Universitário CESMAC and Mix Cópia 3 VEM Autorizo a reprodução parcial ou total desta obra, para fins acadêmicos, desde que citada a fonte 4 VEM Apresentação O II Workshop Visualização, Evolução e Manutenção de Software (VEM 2014) é um dos eventos integrantes do V Congresso Brasileiro de Software: Teoria e Prática (CBSoft 2014), realizado em Maceió – AL, no período de 28 de Setembro a 3 de Outubro de 2014. O VEM tem como objetivo integrar as comunidades das áreas de visualização, manutenção e evolução de software, oferecendo um fórum em território brasileiro onde pesquisadores, estudantes e profissionais podem apresentar seus trabalhos e trocar ideias a respeito dos princípios, práticas e inovações recentes em suas respectivas áreas de interesse. O VEM surgiu a partir da junção de dois outros workshops brasileiros focados em temas relacionados que até então vinham sendo realizados de forma separada, a saber: Workshop de Manutenção de Software Moderna (WMSWM) e Workshop Brasileiro de Visualização de Software (WBVS). O Comitê de Programa (CP) do VEM 2014 é formado por 34 pesquisadores atuantes nas áreas de visualização, manutenção e evolução de software, provenientes de diversas regiões do Brasil e de outros países da América Latina. Os membros do CP foram responsáveis pela seleção de 14 artigos completos para serem apresentados no VEM 2014, de um total de 23 artigos submetidos. Cada artigo submetido foi avaliado por pelo menos três membros do CP, com base nos critérios de originalidade, qualidade técnica e adequação ao escopo do workshop. Os artigos selecionadas abrangem diversos temas de interesse do evento, como gerência de configuração, métricas, análise arquitetural, e ferramentas de apoio à visualização, reutilização, manutenção, reengenharia e migração de software. Além da apresentação dos quatorze artigos selecionados pelo CP, o programa técnico do VEM 2014 inclui ainda um palestra convidada onde os participantes do evento puderam discutir os problemas e soluções mais relevantes atualmente nas áreas de visualização, manutenção e evolução de software, bem como novas oportunidades de pesquisa e desenvolvimento tecnológico nessas áreas. Para finalizar, gostaríamos de agradecer a todos os autores que submeteram artigos ao VEM 2014, pelo seu interesse, aos membros do CP, pelo esforço e valiosa colaboração durante o processo de seleção dos artigos, e aos organizadores e patrocinadores do CBSoft 2014, pelo apoio na realização do evento. Maceió, 28 de Setembro de 2014 Eduardo Figueiredo e Renato L. Novais Coordenadores do Comitê de Programa do VEM 2014CBSoft 2014 5 VEM Foreword The 2nd Workshop on Software Visualization, Evolution and Maintenance (VEM 2014) is part of the 5th Brazilian Congress on Software: Theory and Practice (CBSoft 2014), held in Maceió – AL, from September 28 to October 3, 2014. Its main goal is to foster the integration of the software visualization, evolution and maintenance communities, providing a Brazilian forum where researchers, students and professionals can present their work and exchange ideas on the principles, practices and innovations related to their respective areas of interest. VEM was created from the fusion of two previous Brazilian workshops on related themes, namely Workshop on Modern Software Maintenance (WMSWM) and Brazilian Workshop on Software Visualization (WBVS). The VEM 2014 Program Committee (PC) is composed of 34 active researchers in the areas of software visualization, evolution and maintenance, who come from several regions of Brazil as well as from other Latin American countries. The PC members selected 14 full papers to be presented at VEM 2014, from a total of 23 submissions. Each submission was evaluated by at least three PC members, based on their originality, technical quality and adequacy to the event's scope. The selected papers cover several themes of interest to the workshop, such as configuration management, metrics, architectural analysis, and tool support for software visualization, reuse, maintenance, reengineering and migration. In addition to the fourteen full papers selected by the PC, the VEM 2014 technical program also includes an invited keynote talk where the event participants could discuss the main problems and solutions related to software visualization, evolution and maintenance, as well as new research and technological development opportunities in these areas. Finally, we would like to express our deepest gratitude to all authors who submitted their work to VEM 2014, for their interest, to the PC members, for their effort and invaluable collaboration during the paper selection process, and to the CBSoft 2014 organizers and sponsors, for their support and contribution. Maceió, September 28, 2014 Eduardo Figueiredo and Renato L. Novais VEM 2014 Program Committee Co-chairs 6 VEM Biografia dos Coordenadores Eduardo Figueiredo Eduardo Figueiredo é professor adjunto do Departamento de Ciência da Computação e coordenador do Laboratório de Engenharia de Software (LabSoft) da Universidade Federal de Minas Gerais (UFMG). Doutor em Engenharia de Software pela Universidade de Lancaster no Reino Unido (2009). Eduardo possui ainda mestrado em Informática pela Pontifícia Universidade Católica do Rio de Janeiro (2006) e bacharelado em Ciência da Computação pela Universidade Federal de Ouro Preto (2003). Tem experiência na área de Ciência da Computação, com ênfase em Engenharia de Software, atuando principalmente nos seguintes temas: medição de software, padrões de projeto e implementação, reutilização de software, estudos empíricos e desenvolvimento de software orientado a aspectos. Renato Lima Novais Renato Novais é professor efetivo do Instituto Federal de Educação, Ciência e Tecnologia da Bahia (IFBA). Obteve o titulo de Doutor em Ciência da Computação pela Universidade Federal da Bahia, em 2013, com período sanduíche no Fraunhofer Center for Experimental Software Engineering, MD, EUA. Suas principais áreas de pesquisa são visualização de software, evolução de software, engenharia de software experimental, manutenção e reengenharia de software, e compreensão de software. 7 VEM Chairs Short Biographies Eduardo Figueiredo Eduardo Figueiredo is a associate professor at Federal University of Minas Gerais (UFMG) and coordinator of the Laboratory of Software Engineering (LabSoft). He holds a Ph.D. degree in Software Engineering from Lancaster University, United Kingdom (2009). Eduardo also has master's degree in Computer Science from the Pontifical Catholic University of Rio de Janeiro (2006) and a BA in Computer Science from the Federal University of Ouro Preto (2003). He has experience in Computer Science with emphasis on Software Engineering, mainly in the following topics: software measurement, design patterns and implementation, software reuse, empirical studies and aspect-oriented software development. Renato Lima Novais Renato Novais is an effective professor at Instituto Federal de Educação, Ciência e Tecnologia da Bahia (IFBA). He holds a D.Sc. degree in Computer Science from Universidade Federal da Bahia. During his Doctorate, he spent a period as a visiting scientist in Fraunhofer Center for Experimental Software Engineering, MD, USA. His main research areas are software visualization, software evolution, experimental software engineering, software maintenance and reengineering, and software comprehension. 8 VEM Comitês Técnicos / Program Committee Comitê Diretivo / Steering Committee Claudia Werner - Universidade Federal do Rio de Janeiro (COPPE/UFRJ) Eduardo Figueiredo - Universidade Federal de Minas Gerais (UFMG) Heitor Costa - Universidade Federal de Lavras (UFLA) Leonardo Murta - Universidade Federal Fluminense (UFF) Nabor Mendonça - Universidade de Fortaleza (UNIFOR) Renato Novais - Instituto Federal da Bahia (IFBA) Comitê do programa / Program Committee Alexandre Bergel - University of Chile, Chile Aline Vasconcelos - Instituto Federal de Educação, Ciência e Tecnologia Fluminense (IFF) Claudia Werner - Universidade Federal do Rio de Janeiro (COPPE/UFRJ) Claudio Sant'Anna - Universidade Federal da Bahia (UFBA) Delano Beder - Universidade Federal de São Carlos (UFSCar) Eduardo Figueiredo - Universidade Federal de Minas Gerais (UFMG) Elder Cirilo - Universidade Federal de São João del-Rei (UFSJ) Elisa Huzita - Universidade Estadual de Maringá (UEM) Glauco Carneiro - Universidade Salvador (UNIFACS) Gustavo Rossi - Universidad Nacional de La Plata, Argetina Heitor Costa - Universidade Federal de Lavras (UFLA) Humberto Marques - Pontifícia Universidade Católica de Minas Gerais (PUC Minas) Joberto Martins - Universidade Salvador (UNIFACS) Jorge César Abrantes de Figueiredo - Federal University of Campina Grande (UFCG) Kécia Ferreira - Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG) Leonardo Murta - Universidade Federal Fluminense (UFF) Lincoln Rocha - Universidade Federal do Ceará (UFC) Manoel Mendonca - Universidade Federal da Bahia (UFBA) Marcelo Maia - Universidade Federal de Uberlândia (UFU) Marcelo Pimenta - Universidade Federal do Rio Grande do Sul (UFRGS) Marco Antônio Pereira Araujo - Instituto Federal do Sudeste de Minas Gerais (IF Sudeste MG) Marcos Chaim - Universidade de São Paulo (USP) Maria Istela Cagnin - Universidade Federal de Mato Grosso do Sul (UFMS) Nabor Mendonça - Universidade de Fortaleza (UNIFOR) Paulo Henrique Maia - Universidade Estadual do Ceará (UECE) Pedro Santos Neto - Universidade Federal do Piauí (UFPI) Renato Lima Novais - Instituto Federal da Bahia (IFBA) Ricardo Ramos - Universidade Federal do Vale do São Francisco (UNIVASF) Ricardo Terra - Universidade Federal de Lavras (UFLA) Rodrigo Spinola - Universidade Salvador (UNIFACS) Rosana Braga - Universidade de São Paulo (ICMC/USP) 9 VEM Rosângela Penteado - Universidade Federal de São Carlos (UFSCar) Sandra Fabbri - Universidade Federal de São Carlos (UFSCar) Valter Camargo - Universidade Federal de São Carlos (UFSCar) Revisores Adicionais / Additinal Reviewers Anderson Belgamo - Instituto Federal de São Paulo - Campus Piracicaba (IFSP-PRC) Andre Freire - Universidade Federal de Lavras (UFLA) Juliana Padilha - Universidade Federal de Minas Gerais (UFMG) Marcelo Ramos - Universidade de São Paulo (USP) 10 VEM Comitê organizador / Organizing Committee COORDENAÇÃO GERAL Baldoino Fonseca - Universidade Federal de Alagoas (UFAL) Leandro Dias da Silva - Universidade Federal de Alagoas (UFAL) Márcio Ribeiro - Universidade Federal de Alagoas (UFAL) COMITÊ LOCAL Adilson Santos - Centro Universitário Cesmac (CESMAC) Elvys Soares - Instituto Federal de Alagoas (IFAL) Francisco Dalton Barbosa Dias - Universidade Federal de Alagoas (UFAL) COORDENADORES DO VEM 2014 Eduardo Figueiredo - Universidade Federal de Minas Gerais (UFMG) Renato Novais - Instituto Federal da Bahia (IFBA) 11 VEM Índice / Table of Contents Artigos Completos / Full Papers TS1 – Visualization, Evolution, Maintenance and Experimental Studie What Questions Developers Ask During Software Evolution? An Academic Perspective Renato Novais, Creidiane Brito, Manoel Mendonça 14 Um Estudo Empírico do Uso da Comunicação para Caracterizar a Ocorrência de Dependências de Mudança no Projeto Ruby on Rails Igor Wiese, Reginaldo Re, Rodrigo Takashi Kuroda, Gustavo Oliva, and Marco Aurelio Gerosa 22 30 Análise de Métricas Estáticas para Sistemas JavaScript Miguel Ramos and Marco Tulio Valente Migração Parcial de um Banco de Dados Relacional para um Banco de Dados NoSQL na Nuvem Através de Adaptações Não-intrusivas: Um Relato de Experiência Caio Costa, Lincoln Rocha, Nabor Mendonca, and Paulo Maia 38 TS2 - Software Visualization, Education And Reenginering Polimorphic View: Visualizando o Uso de Polimorfismo em Projetos de Software Fábio Petrillo, Guilherme Lacerda, Marcelo Pimenta, and Carla Freitas 46 On the Use of Context Information for Supporting Software Visualizations Renan Vasconcelos, Marcelo Schots, and Claudia Werner 54 ArchGraph: Modularização Automática de Sistemas Usando Clusterização de Grafos de Dependência Guilherme Avelino and Marco Tulio Valente 62 SimMS - Um Jogo Educacional de apoio ao Ensino de Manutenção de Software Diógenes Dias Simão, Dyeimys Franco Correa, and Paulo Afonso Parreira Júnior 70 ProFap-R: Um Processo de Reengenharia de Código Orientada pela 78 12 VEM Reengenharia de Dados Eduardo Fernandes, Ygo Brito, Inara Ortiz, Nathalia Borine, and Maria Istela Cagnin TS3 - Bad Smells and Refactoring Influencing Factors on Code Smells and Software Maintainability: A Cross-Case Study Tassio Vale, Iuri Souza, and Claudio Sant'Anna 86 How Developers Deal with Code Smells: the Case of the SourceMiner Evolution Team Alcemir Santos, Mário André Farias, Eduardo Santana de Almeida, Manoel Mendonca, and Cláudio Sant'Anna 94 Um Método para Identificação de Bad Smells a partir de Diagramas de Classes Henrique Nunes Gomes, Mariza Bigonha, Kecia Ferreira, and Flávio Madureira 102 KDM-RE: A Model-Driven Refactoring Tool for KDM Rafael Durelli, Bruno Santos, Raphael Honda, Marcio Delamaro, and Valter Camargo 110 TS4 – VEM history Uma Análise da História do VEM, WBVS e WMSWM Renato Novais, Thiago Mendes, and Fernando Teles 13 118 VEM What Questions Developers Ask During Software Evolution? An Academic Perspective Renato Novais1 , Creidiane Brito1 , Manoel Mendonça2 1 2 Federal Institute of Bahia, Salvador – BA – Brazil Fraunhofer Project Center for Software and Systems Engineering at UFBA Salvador – BA – Brazil {renato,creidianebrito}@ifba.edu.br, [email protected] Abstract. Many studies on software evolution propose new approaches. One needs to validate the approaches. For that, it is common to conduct experimental studies where participants have to answer questionnaires with questions related to the research topic. Those questions must be relevant, otherwise the validation may be invalid. In this context, this study investigates which questions (and so the tasks) developers really answer (and perform) during software evolution. To this end, a survey comprised of 11 questions was applied to 42 participants from academia. This study allowed to derive an initial model on questions developers ask during software evolution, and to understand how the participants agreed with the relevance of the questions. 1. Introduction Several studies on software evolution and maintenance propose new methods, techniques, and tools. To validate their approach, it is common to conduct experimental evaluation, where they try to answer questions or to perform maintenance tasks. For example, in [Wettel et al. 2011], the authors used a set of ten program comprehension and design quality assessment questions to investigated the efficiency and correctness using software visualization. In [Bavota et al. 2012], the authors analyzed the impact of test smells on program comprehension during maintenance activities. For that, they applied a questionnaire with 16 questions related to software test. In [Hattori et al. 2013], the authors also evaluated their tool based on a set of six evolution tasks. And in [Novais et al. 2012b] and [Novais et al. 2012a], the authors evolved a software evolution visualization tool motivated by the need to answer two feature evolution comprehension questions. The relevance of the questions or tasks used is, in general, based on literature reports. However, if those tasks are not really used on the state of the practice, the approaches and therefore, their evaluation, may not guarantee their applicability. Based on this assumption, we decided to investigate which questions (and so the tasks) developers really answer (and perform) during software evolution. The study presented in [Sillito et al. 2006] already investigated this topic. In our study, we decided to go further to see if the questions reported in that study, and in others found in the literature, are really relevant for developers and practitioners. [Sillito et al. 2006] conducted two qualitative studies of programmers (newcomers and industrial programmers) performing change tasks to medium to large sized programs. Based on those studies, they cataloged and categorized 44 different kinds of questions asked by their participants. [de Alwis and Murphy 2008] highlighted the difficulty 14 VEM of programmers have to answer questions as they investigate the functioning of a software system. They must piece together results from different tools to determine an answer to the initial query. To overcome this issue, they proposed a model that supports the integration of different sources of information about a program and a tool that implements this model. On the same token, [Fritz and Murphy 2010] also pointed out the challenges on answering a variety of questions that require the integration of different kinds of project information. To investigate this topic they interviewed 11 professional developers. From this step, they identified 78 questions developers want to ask, but for which support is lacking. The general goal of this work is to investigate how academics and practitioners see those questions, and discover if they are following the same directions. If the answers are no, we may have a big issue on the directions of the research on the academic context that should be always well aligned with real industrial problems. In this paper, we present the results of the investigation with the academic researchers. To this end, we performed a survey with 11 questions and with 42 people from academia. This paper contributes with the results of this survey on the academic perspective and also presents an initial model for questions developers ask. This paper is organized as follows. Section 2 presents the experimental evaluation. Section 3 shows the results of the study. Section 4 discusses some threats to validity. Finally, Section 5 concludes this paper, presenting directions for future works. 2. Experimental Evaluation 2.1. Goal Definition This study is part of a larger study that aims to investigate what questions are relevant during software evolution. The goal is to collect the academic and practice perspective and compare the results. In this paper, we present the first part: the academic perspective. 2.2. Planning Selection of suitable set of questions. The first step on this study was to identify a set of questions that could be used on the survey. Therefore, we conducted a literature review on the study context.We selected eight papers that report questions developers ask while performing software evolution tasks [Sillito et al. 2006] [de Alwis and Murphy 2008] [Fritz and Murphy 2010] [D’Ambros and Lanza 2007] [Tu and Godfrey 2002] [German et al. 2004] [Ackermann and Zazworka 2010] [D’Ambros and Lanza 2009]. The first three papers are the main reference points since they are focused on the same topic: investigate questions programmers ask during software evolution tasks. This step generated a list of 212 questions. This set of questions is very large, which is fairly impossible to apply a survey with all of them. To overcome this issue, we decided to group the questions. We observed that the questions had intersections and could be grouped in what we called Representative Questions. Each representative question grouped similar questions we found in the papers. For example, a representative question ’What module has been recently modified?’ may refers to similar questions as ’What classes have been changed?’, ’Which API has changed (check on web site)?’, or ’What methods or functions were changed?’, etc. 15 VEM Regarding the grouping step, we rely on the three most qualified experts to ensure the soundness of our clustering. In short, the experts validated the mapping of 212 questions to the 11 questions reported in Table 1. Table 1. List of Questions. Question Description Q1 What is the impact of a change in the source code? Q2 Which module has been recently modified? Q3 Which module has undergone more changes? Q4 When a change occurred in the source code? Q5 Who has changed a module? Q6 Who has more impact in a given module? Q7 How much work has someone performed in some module? Q8 Where particular person has worked? Q9 For a given module, what are the changes that affected it? Q10 What was the reason behind the changes made in a given module? Q11 How was the process of changing a module? Response options for each question. The participants had to answer the questions according to two perspectives. First, the level of relevance for each question. The options were: i) Completely Irrelevant (CI); ii) Little Relevant (LR); iii) Relevant (R); and iv) Very Relevant (VR). Second, whom the information that the question addresses is related to. The options were: i) Software Developer; Software Manager; iii) Both; and iv) None. Participants. The survey had 42 participants. We selected master and PhD students from an experimental software engineering class at Federal University of Bahia, and students from a specialization from a scientific seminar class at Federal Institute of Bahia. We asked the participants to answer five questions about themselves. They were: c1) How many software deployed for the client have you developed any software maintenance activity?; c2) How many years have you worked with software development activities?; c3) How do you consider yourself regarding to someone else that most know about the related topics? (I am fair below, I am little below, I am at the same level, I am above); c4) What is your position on the current company (if working)?; and c5) Do you consider yourself more academic or practitioner? Figure 1 shows the participant characterization. Question c4 had very different answers so we omitted it. 2.3. Execution The execution process was conducted during master and PhD class sections at Federal University of Bahia and during a specialization class section at Federal Institute of Bahia. The participants took no more than 30 minutes to answer the survey. They had to answer the survey, and then fill a form characterizing them. 16 VEM Figure 1. Characterization of the survey’s participants. 3. Results 3.1. An Initial model for questions developers ask Figure 2 presents an initial model derived from the grouping questions step. Most of the questions had a relationship among them. We observed that there are three important entities of interest when asking question related to software evolution: change (modification report), source code (module), author (user, developer). The questions may be only related to the specific entity (e.g. what are the authors?, what are the modules of the software?), but generally they relate two entities of interest (e.g. which author modified this module?). Figure 2 depicts six questions relating two by two of these entities. The arrows link the two entities, and the direction of the arrow means the main entity on the question. The arrows highlight the historical information of interest. The color of the arrow portrays the stakeholder (developer, manager, both) that can use the information provided by the task that answers the question. We observed that the question is important to the manager, the manager and the developer, but never only for the developer. This is acceptable since the manager should understand every think about the project. There are still two important dimensions that can be added to these questions: time and effort. It is common to find question like: what changes have recently affected this module? and which authors have mostly worked on this module ? We believe that developers of software evolution may benefit from this initial model. They can use it as a initial guide of questions that their tool should try to answer. 3.2. Questionnaire’s answers Figure 3 shows the total of answers per each question of the survey. It presents the big picture of the survey answers. For each question there are at most four bars. From left to right side, the bars mean: Completely Irrelevant, Little Relevant, Relevant, and Very Relevant.1 The first insight one may have from this picture is that most questions had the Relevant as the main response. Only questions Q1, Q4, and Q9 had the Relevant option response less than 50%. The others overlay this mark. Even more, only question Q1 the Relevant option was not the highest option. 1 View it on the computer screen, or in a color printed version for best results 17 VEM Figure 2. An Initial Model for questions developers ask As can be observed, few questions had Completely Irrelevant answer (Q1: 2; Q6: 4; Q8: 1; and Q10: 2). The question with highest value for this category was the Q6, with 4 respondents. This question is related to who has more impact in a given module. In other words, who has changed more the given module? On the other hand, 50% of the respondents agreed that this question is Relevant. The category Little Relevant is presented in all of the questions. The highest values are for the questions Q5 and Q7 with 14 respondents. In all of the questions, it was higher or equal to the category Completely Irrelevant. On the same token, the category Relevant is also presented in all of the questions. The highest values were for the questions Q2, Q3, and Q8 with 29, 26 and 27 respondents, respectively. It is also important to notice that, for all the questions, this category had higher value than the category Little Relevant. All questions have at least four respondents on the category Very Relevant. For the question Q1, 71.43% of the respondents selected this category. This is also the highest agreement of the participants. Figure 4 shows how the participants evaluated each question considering whom the information that the question addresses is related to. Again, for each question there are at most four bars. From left to right side, the bar means: Software Developer, Software Manager, Both, None. The category Software Developer was presented in all of the questions. Question Q7 had the lowest value for this category: 1, while question Q2 had the highest. The category Software Manager was in almost all questions. Only question Q1 had no respondents for this category. The three highest score for this category were on questions Q7, Q8 and Q7, with 31, 29, and 22, respectively. Moreover, question Q7 had the highest value among all questions and categories. 18 VEM Figure 3. Participants’ answers per question. The category Both considered Software Developer and Software Manager. It was also presented in all of the question. The highlights were for the question Q1, Q10 and Q9, with 30, 23 and 22 scores, respectively. Finally, the category None is presented in 7 questions, with no more than 5 answers (question Q6). Analyzing both Figures 3 and 4, it is possible to observe that question Q11 has two respondents for None category, and zero respondents for Completely Irrelevant. This may mean that the participants believed this question was Little Relevant, Relevant, or Very Relevant, for someone else not the Software Developer or Software Manager. Questions Q2, Q4, Q6, and Q7 present the same pattern. 3.3. Discussion The results showed that most participants aggreed with the relevance of those selected questions. To support this affirmation, let’s considers grouping the results between the categories, as follows: negative category (Completely Irrelevant and Little Relevant) and positive category (Relevant and Very relevant). In this case, it is possible to observe that all questions had positive answers with more than 50%. The questions Q5, Q6 and Q7 had the lowest level, with 28, 25 and 28 respondents, respectively. The others were higher than 30 respondents. Questions Q3, Q1, and Q10 had the highest values, with 40, 39 and 38, respectively. As a general conclusion, according to these results, the questions/tasks are important on the state of the practice, when one needs to evolve his/her software. This guide us to conduct the second part of the larger study, that will investigate how expert (and real practical) people agree with the relevance of those questions/tasks. 4. Threats to Validity This study has some threats to validity. The first one we identified is the way we used to select the first set of questions. We started by the most referenced papers on the topic we know [Sillito et al. 2006] [de Alwis and Murphy 2008] [Fritz and Murphy 2010]. As 19 VEM Figure 4. Relevance of the questions for stakeholders. they are from the same research group, we decide to add other papers we found that also had questions/tasks that developers ask/perform. Other threat may be related to the first group of task. We needed to reduce the number of questions. Therefore, we requested experience people to help us on this step. Even we based on expert opinions, this may be biased. One could for example, conduct a larger survey with independent expert people. The lower statistical power is a threat to the conclusion validity since we did not used strong statistical techniques to analyse the results. Finally, but not lastly, we point to the participants we selected. They may not be representative, however we tried to select the most heterogeneous we could count on. 5. Final Remarks This paper presents an academic perspective survey on questions developers ask during software evolution. It was motivated by repeatability that researchers use such question on the validation of their studies. The survey was composed of 11 questions and was applied to 42 respondents. The studies allowed us: i) to derive an initial model on questions developers ask during software evolution, and ii) to understand how the participants agreed with the relevance of the questions. The work presented here is part of a larger study, which intends to investigate and compare how academic and practitioners envision those questions on the state of practice. Thus, as a future work, we aim to apply the same survey with industrial participants and compare the results with the academic participants. Other direction is to analyze the produced information per participant level. This may guide us to a further understanding about the produced data. References Ackermann, C. and Zazworka, N. (2010). Codevizard: Combining abstraction and detail for reasoning about software evolution. Thecnical Report - University of Mariland. 20 VEM Bavota, G., Qusef, A., Oliveto, R., De Lucia, A., and Binkley, D. (2012). An empirical analysis of the distribution of unit test smells and their impact on software maintenance. In Proceedings of the 28th IEEE International Conference on Software Maintenance, ICSM’12, pages 56–65. D’Ambros, M. and Lanza, M. (2007). Bugcrawler: Visualizing evolving software systems. In Proceedings of the 11st European Conference on Software Maintenance and Reengineering, CSMR’07, pages 333–334, Washington, DC, USA. IEEE Computer Society. D’Ambros, M. and Lanza, M. (2009). Visual software evolution reconstruction. J. Softw. Maint. Evol., 21(3):217–232. de Alwis, B. and Murphy, G. (2008). Answering conceptual queries with ferret. In Proceedings of the 30th ACM/IEEE International Conference on Software Engineering, ICSE’08, pages 21–30. Fritz, T. and Murphy, G. C. (2010). Using information fragments to answer the questions developers ask. In Proceedings of the 32nd ACM/IEEE International Conference on Software Engineering, ICSE’10, pages 175–184, New York, NY, USA. ACM. German, D., Hindle, A., and Jordan, N. (2004). Visualizing the evolution of software using softChange. In Proc. Int. Conf. on Software Engineering & Knowledge Engineering, SEKE’04, pages 336–341, New York NY. ACM Press. Hattori, L., D’Ambros, M., Lanza, M., and Lungu, M. (2013). Answering software evolution questions: An empirical evaluation. Inf. Softw. Technol., 55(4):755–775. Novais, R., Lima, Paulo, R., and Mendonça, M. (2012a). Timeline matrix: an on demand view for software evolution analysis. In Proc. of the 2nd Brazilian Workshop on Software Visualization, WBVS’12, pages 1–8. Novais, R., Nunes, C., Lima, C., Cirilo, E., Dantas, F., Garcia, A., and Mendonca, M. (2012b). On the proactive and interactive visualization for feature evolution comprehension: An industrial investigation. In Proc. of the 34th International Conference on Software Engineering, ICSE’12, pages 1044–1053. Sillito, J., Murphy, G. C., and De Volder, K. (2006). Questions programmers ask during software evolution tasks. In Proceedings of the 14th ACM SIGSOFT International Symposium on Foundations of Software Engineering, SIGSOFT’06/FSE-14, pages 23– 34, New York, NY, USA. ACM. Tu, Q. and Godfrey, M. W. (2002). An integrated approach for studying architectural evolution. In Proceedings of the 10th International Workshop on Program Comprehension, IWPC’02, pages 127–, Washington, DC, USA. IEEE Computer Society. Wettel, R., Lanza, M., and Robbes, R. (2011). Software systems as cities: a controlled experiment. In Proceedings of the 33rd International Conference on Software Engineering, ICSE’11, pages 551–560, New York, NY, USA. ACM. 21 VEM Um estudo empírico do uso da comunicação para caracterizar a ocorrência de dependências de mudança no projeto Ruby on Rails Igor S. Wiese1, Rodrigo T. Kuroda2, Reginaldo Ré1, Gustavo A. Oliva3, Marco A. Gerosa3 1 Programa de Pós Graduação em Informática – Universidade Tecnológica Federal do Paraná – Campus Cornélio Procópio 2 Departamento de Ciência da Computação Universidade Tecnológica Federal do Paraná – Campus Campo Mourão – PR – Brasil 3 IME/USP – Departamento de Ciência da Computação Universidade de São Paulo (USP) - São Paulo – SP– Brasil {igor,reginaldo}@utfpr.edu.br, [email protected], {goliva,gerosa}@ime.usp.br Abstract. This paper studies the communication to characterize the occurrence of change dependencies. First, we propose separate change dependencies into strong and weak ones, according to the distribution of their occurrence in a release. Then, using classification algorithms and metrics from the social network extracted from traces of developers’ communication, we found that it is possible to characterize strong and weak change dependencies. The percentage of correctly classified pair of files stood in the range of 72-98%. We also used feature selection algorithms to identify the best metrics. Resumo. Este trabalho estuda a comunicação para caracterizar a ocorrência de dependências de mudança. Primeiro, nós realizamos a separação das dependências de mudança em fortes e fracas, de acordo com a distribuição da sua ocorrência por release. Depois, utilizando algoritmos de classificação e métricas da rede social extraída a partir de rastros de comunicação de desenvolvedores, nós descobrimos que é possível caracterizar os tipos de dependências de mudanças fortes e fracas. Nós obtivemos um percentual de 72-98% de pares de arquivos corretamente classificados. Nós também utilizamos algoritmos de seleção de atributos para identificar as melhores métricas. 1. Introdução Sistemas de software são compostos de artefatos que dependem uns dos outros. Como resultado, alguns artefatos evoluem conjuntamente durante o desenvolvimento do software [Canfora et al. 2014]. Ball et al. (1997) foram os primeiros pesquisadores a observar esse fenômeno de forma empírica ao minerar logs do sistema de controle de versão de um compilador. No ano seguinte, Gall et al. (1998) chamaram essa relação de coevolução de dependência lógica (do inglês, logical dependency). Ao passar do tempo, outros nomes passaram a ser mais utilizados na literatura, incluindo dependências de mudança (change dependencies), dependências evolucionárias (evolutionary dependencies), e comudanças históricas (historical co-changes). Neste artigo, utilizaremos o termo dependências de mudança. 22 VEM Há uma série de estudos referentes à identificação de dependências de mudança [Canfora et al. 2010; Ying et al. 2004; Zimmermann et al. 2005], dos quais destacam-se a proposta de Zimmermann et al. (2005). Tal estudo foi amplamente utilizado pelos trabalhos que aplicam dependências de mudança para melhorar a qualidade do software. Entretanto, poucos estudos têm direcionado esforços para caracterizar a ocorrência de dependências de mudança, isto é, as razões por detrás da formação de tais dependências [Oliva et al. 2011]. Zhou et al. (2008) predizem a existência ou ausência de dependência de mudança entre dois arquivos usando métricas como a existência de dependência estática de código, ocorrência de dependência de mudança entre dois arquivos no passado, a idade da mudança e quem realizou a mudança. Oliva e Gerosa, mostraram que a existência de um acoplamento estrutural nem sempre leva a formação de dependências de mudanças [Oliva and Gerosa 2011]. Embora trabalhos anteriores tenham desconsiderado aspectos sociais, o desenvolvimento de software é inerentemente uma atividade sociotécnica, especialmente dada a necessidade de colaboração e comunicação entre os envolvidos no projeto [Cataldo et al. 2009]. De fato, no começo de 1968, Conway formulou a hipótese de que organizações que projetam sistemas são restringidas a produzir projetos que são cópias de suas próprias estruturas de comunicação [Conway 1968]. Então, a “Lei de Conway” assume, de certa forma, uma associação entre a arquitetura do software e as relações sociais. Influenciados pela Lei de Conway, alguns pesquisadores defendem que a interação entre os desenvolvedores pode impactar diretamente na qualidade da arquitetura do software, e por meio desta, transitivamente, influenciar na formação das dependências de mudança [Sebastiano Panichella 2014]. Este trabalho contribui de duas formas. Primeiro, nós dividimos as dependências de mudança em dois grupos: fortes e fracas. Nós propomos esta divisão porque entendemos que algumas dependências podem precisar ser priorizadas em relação a outras. Neste sentido, entender as origens da formação de dependências fortes e fracas é mais importante do ponto de vista prático, que prever ausência ou ocorrência de dependências de mudanças. Segundo, nós investigamos se métricas obtidas a partir da comunicação dos desenvolvedores em torno das suas contribuições (pull requests) podem caracterizar a formação destes dois grupos de dependências de mudança. Desta forma, inspirados na lei de Conway, nós utilizamos métricas de análise de redes sociais para caracterizar as origens das dependências fortes e fracas entre pares de arquivos em uma mesma release. Nós utilizamos o termo caracterizar ao invés de predizer, uma vez que não estamos coletando as métricas em uma release para prever a ocorrência em outra release. Nós estamos usando os algoritmos de classificação para determinar métricas relevantes para cada um dos grupos de dependência de mudança propostos. Duas questões de pesquisa foram investigadas neste trabalho: QP1) É possível caracterizar dependências de mudança fortes e fracas utilizando métricas obtidas a partir da comunicação dos desenvolvedores? QP2) Quais métricas utilizadas foram mais relevantes para esta caracterização? Entender as origens da formação destas dependências é importante, pois pode ajudar na elaboração de métodos mais robustos para a identificação destas. Além disto, já se sabe que dependências de mudanças podem ser utilizadas, por exemplo, para 23 VEM prever defeitos [D’Ambros et al. 2009] e realizar análise de impacto de mudança [Zimmermann et al. 2005] 2. Metodologia Nas Subseções abaixo, nós descrevemos os passos para coletar e identificar as dependências fortes e fracas a partir das submissões de pull-requests, como as métricas de redes sociais são obtidas da comunicação dos desenvolvedores nos pull-requests e como usamos os algoritmos de classificação para caracterizar dependências de mudanças fortes e fracas. 2.1. Coleta de dados e identificação das dependências de mudanças fortes e fracas O projeto Ruby on Rails1 foi utilizado como objeto de estudo neste trabalho. Este projeto foi escolhido baseado no nível de interesse da comunidade de desenvolvedores que contribui no repositório Github. Ao todo, o projeto Rails possui mais de 22.200 “estrelas” e 8.300 forks do seu código. Nós usamos a API do GitHub2 para coletar os dados do histórico de quatro releases. Releases anteriores foram descartadas por não terem todo seu histórico de commits ou pull requests completos no Gitub. Desta forma, foram coletados dados sobre as modificações dos arquivos e as discussões realizadas pelos desenvolvedores em cada pull request. Para encontrar as dependências de mudança e separá-las em dependências de mudança fortes e fracas, nós seguimos os seguintes passos: 1. Agrupar todos os pull requests e commits por relase 2. Remover cada pull request sem commit ou com commits que não foram integrados (merged) no projeto; 3. Se em um pull request existir mais de um commit, juntá-los em uma única transação; 4. Combinar todos os arquivos modificados em um pull request em pares de arquivos, excluindo arquivos que tem extensão de imagens e textos; 5. Aplicar o algoritmo de regra de associação APRIORI, utilizado por Zimmermman (2005) para encontrar as dependências de mudança definindo um valor limiar para suporte e outro para confiança. Para este trabalho nós utilizamos suporte igual a 2 e confiança igual a 30%; 6. Analisar a distribuição das dependências de mudança encontradas após o algoritmo de regra de associação para atribuir as dependências de mudanças a um grupo (forte ou fraco). Assim, pares de arquivos que formam dependências acima ou iguais ao valor de limiar do terceiro quartil serão atribuídos ao grupo “forte”. As demais dependências de mudança estarão no grupo “fraca”. Desta forma, as dependências fortes representam pelo menos 25% das dependências mais recorrentes após a aplicação do algoritmo de regra de associação. Estas dependências, são as que devem receber mais atenção dos desenvolvedores, por exemplo, se houver a necessidade de priorização de revisão de código ou cobertura de testes. 1 Detalhes do projeto podem ser encontrados na página oficial: http://rubyonrails.org e no Github: https://github.com/rails/rails. 2 Para mais detalhes acessar: https://developer.github.com/v3/ 24 VEM 2.2. Redes Sociais e Métricas de Análise de Redes Sociais (SNA) Em nossa rede de comunicação, cada desenvolvedor que comentou em um pull request incluído no nosso estudo representa um nó. Arestas direcionadas representam a troca de mensagens entre os desenvolvedores. Nós adicionamos peso nas arestas contando a quantidade de vezes que um desenvolvedor interagiu com outro sobre a sequência de comentários. Depois da rede criada, nós utilizamos a API Jung3 para calcular as métricas de análise de redes sociais. Nós calculamos 18 métricas que correspondem a métricas de centralidade da rede (degree, betweenness, closeness, e eigenvector), medidas de ego network (ego Betweenness, ego size, ego ties e ego density), medidas de structural hole (efficiency, effective size, constraint e hierarchy) e medidas globais (size, ties, density, diameter, número de mensagens e número distintos de desenvolvedores que comentaram). Mais detalhes sobre as métricas pode ser encontrados em [Wasserman and Faust 1994]. Além das métricas de rede social, nós também adicionamos três métricas obtidas do histórico de modificações. Nós adicionamos as medidas de code churn do arquivo um (codeChurn), code churn do arquivo dois (codeChurn2) e a média do code churn entre os dois arquivos que formavam o par para todo o histórico da release (codeChurnAVG). Code churn é uma métrica frequentemente utilizada como medida de controle, por ser um bom preditor em outros contextos [Hall et al. 2012]. Desta forma, nosso conjunto de dados final possui 21 métricas. 2.3. Classificação Os algoritmos de classificação leem um conjunto de treinamento e constroem um modelo de aprendizado a partir das métricas que são mais úteis para diferenciar cada uma das classes. Portanto, neste estudo, nós usamos as métricas descritas na Subseção 2.2 como entrada para os algoritmos de classificação. As classes, por sua vez, são as de dependências de mudança fracas e fortes. Desta forma, nós executamos cinco classificadores frequentemente encontrados na literatura, a saber: Naïve Bayes (Bayes), J48 (árvore de decisão), JRip (regras), KNN - K-nearest neighbours (preguiçoso ou IBk lazy) and Bagging (alvo ou target). Entre parênteses estão descritos sob quais critérios os algoritmos criam seus modelos de aprendizagem. Nós selecionamos estes algoritmos para retirar um possível viés nos resultados, por exemplo, se selecionássemos um único algoritmo de classificação os resultados poderiam refletir o sucesso ou fracasso daquele algoritmo em particular com o conjunto de dados utilizado no estudo. Tipicamente, estudos de classificação são avaliados utilizando medidas de sensibilidade (recall), precisão (precision) e área abaixo da curva ROC (AUC) [Demšar 2006]. A sensibilidade identifica a proporção das instâncias de uma determinada classe que o modelo pode recuperar com sucesso. A precisão pode medir a porcentagem correta de identificação de uma classe. A AUC é um bom indicativo para comparar modelos de classificação. Todas as medidas variam de 0 até 1, com o valor 1 representando a perfeita classificação. Para avaliar estas medidas, nós utilizamos a validação cruzada estratificada, que divide o conjunto de dados em n subconjuntos de tamanho aproximadamente igual mantendo a proporção das classes em cada 3 Para mais detalhes acessar: http://jung.sourceforge.net/doc/api/ 25 VEM subconjunto. Os objetos de n – 1 partições são utilizados no treinamento do modelo. O subconjunto restante é usado como teste. A vantagem desta técnica é que todo o conjunto de dados é utilizado para treinamento e teste [Demšar 2006]. 3. Resultados 3.1. QP1) É possível caracterizar dependências de mudança fortes e fracas utilizando métricas obtidas a partir da comunicação dos desenvolvedores? Para verificar se é possível caracterizar dependências de mudança fortes e fracas utilizando as métricas de comunicação, nós primeiro coletamos os dados e definimos quais pares de arquivos representavam uma dependência de mudança forte e fraca para o nosso estudo. Para isto, nós utilizamos os seis passos descritos na Subseção 2.1. A Tabela 1 apresenta a sumarização da coleta de dados de cada uma das quatro releases estudadas. A coluna “máximo suporte” indica a quantidade de dependências de mudança encontradas entre os pares de arquivos. Além desta coluna, a mediana e o terceiro quartil do limiar de suporte são apresentados. A quantidade (#) de pares identificados como fortes e fracos, indica o balanceamento das classes formadas utilizando o algoritmo de regra de associação e a distribuição dos quartis. O percentual de cada classe é apresentado entre parênteses nas colunas #instâncias fortes e fracas. Por fim, são apresentadas a quantidade de pull requests e o total de instâncias (pares de arquivos) identificados em cada release. Desta forma, baseados na divisão do terceiro quartil, nós definimos o rótulo de forte ou fraca para cada dependência de mudança. Por exemplo, na release 3.1, para uma dependência de mudança ser classificada como forte, o valor do suporte dela deveria estar entre 4 e 14 mudanças. Isto significa que dois arquivos, A e B, deveriam ser modificados juntos em pelo menos 4 pull requests. Tabela 1. Sumarização das quatro releases estudadas. Release Máximo Suporte Mediana Suporte Limiar de Suporte (3º Quartil) Mediana Confiança # inst. Fortes # inst. Fracos 3.1 14 6 >= 4 60,00% 873 (45,17%) 1060 (54,83%) 3.2 7 2 >=2 100,00% 216 (46,87%) 215 (53,13%) 229 431 4.0 14 8 >=3 70,17% 513 (39,70%) 778 (60,30%) 1452 1291 4.1 7 2.27 >=2 66,66% 339 (16,12%) 1764 (83,88%) 769 339 # Pull Total de requests Instâncias 303 1933 Para executar os algoritmos de classificação nós utilizamos a ferramenta Weka4, que oferece implementações para os cinco algoritmos mencionados na Subseção 2.3. Utilizando o Weka, nós selecionamos os arquivos de entrada de dados armazenados em CSV, que continham nas linhas, cada uma das instâncias que representavam as dependências de mudança, e nas colunas cada uma das 21 métricas. A última coluna do CSV representava o valor da classe ao qual aquela dependência de mudança pertencia (forte ou fraca). Para cada um dos algoritmos e releases, nós executamos a tarefa de classificação. A Tabela 2 apresenta os resultados da caracterização das dependências de mudança fortes e fracas por meio do uso das métricas sociais e do code churn. Esses resultados foram obtidos com as melhores métricas já selecionadas (discussão na 4 Para acessar mais informações sobre a ferramenta: http://www.cs.waikato.ac.nz/ml/weka/ 26 VEM Subseção 3.2). Observando os valores da AUC, que é a métrica para comparação de modelos, nós observamos que os algoritmos Bagging e KNN tiveram os melhores resultados nas releases 3.1 e 3.2. O algoritmo Bagging teve o melhor desempenho para as release 4.0 e 4.1. Apesar do Bagging ser o melhor algoritmo em todas as releases, somente na release 4.0 é possível perceber uma diferença maior entre os algoritmos. Nesta release, a diferença do Bagging (maior AUC) para o Naïve Bayes (menor AUC) foi de 0.234. A diferença do Bagging para o segundo melhor algoritmo foi somente 0.043. Na Release 4.1 a diferença entre Bagging (maior AUC) para Naïve Bayes (menor AUC) foi de 0.175. Todos os algoritmos, com exceção do Naïve Bayes, tiveram desempenho similar ao Bagging, o que significa dizer que a escolha de um algoritmo, não influencia em diferença de acertos na classificação de dependências de mudança fortes ou fracas. Tabela 2. Resultados da classificação de dependências de mudança forte e fracas Release 3.1 3.2 4.0 4.1 Algoritmos % Instâncias corretamente Classificadas Precisão (forte) Precisão (fraca) Sensibilidade (forte) Sensibilidade (fraca) AUC J48 0,977 0,983 0,974 0,968 0,986 0,977 Bagging 0,981 0,975 0,973 0,967 0,979 0,995 KNN 0,980 0,979 0,977 0,971 0,983 0,995 Naïve Bayes 0,904 0,921 0,892 0,863 0,905 0,943 JRip 0,967 0,967 0,968 0,961 0,973 0,964 J48 0,951 0,953 0,949 0,949 0,953 0,951 Bagging 0,948 0,929 0,971 0,972 0,926 0,986 KNN 0,974 0,977 0,972 0,972 0,977 0,986 Naïve Bayes 0,798 0,911 0,734 0,662 0,822 0,875 JRip 0,951 0,930 0,975 0,977 0,926 0,963 J48 0,869 0,857 0,876 0,805 0,911 0,875 Bagging 0,888 0,898 0,883 0,811 0,940 0,947 KNN 0,874 0,856 0,886 0,823 0,909 0,904 Naïve Bayes 0,721 0,719 0,723 0,493 0,873 0,713 JRip 0,793 0,833 0,778 0,602 0,920 0,789 J48 0,981 0,969 0,984 0,917 0,994 0,976 Bagging 98,24 0.978 0.983 0.912 0.996 0.986 KNN 97,86 0.945 0.985 0.92 0.99 0.984 Naïve Bayes 97,77 0.876 0.911 0.499 0.986 0.805 JRip 98,11 0.943 0.975 0.920 0.935 0.970 Assim, podemos concluir que é possível caracterizar dependências de mudança fortes e fracas utilizando métricas obtidas a partir da comunicação dos desenvolvedores. Esta conclusão é obtida verificando os valores de AUC obtidos nas quatro releases do projeto Rails. Utilizando diferentes algoritmos, nós obtivemos mais de 0.9 de AUC para cada uma das releases. Este resultado mostra que os valores de sensibilidade e precisão foram maiores que 90% em 14 dos 20 testes realizados (5 algoritmos X 4 releases). Somente a release 4.0 não apresentou este índice nas métricas de avaliação medidas. Obviamente, os resultados obtidos não podem ser generalizados para outros projetos, e novos testes devem ser realizados em maior escala para verificar se as métricas de comunicação podem ser úteis em outros projetos. No entanto, os resultados 27 VEM indicam consistência, uma vez que as métricas foram úteis em quatro diferentes releases com mais de um algoritmo de classificação. 3.2. QP2) Quais métricas utilizadas foram mais relevantes para esta caracterização? Para responder a segunda questão de pesquisa, nós utilizamos um algoritmo de seleção de atributos. Para realizar a seleção de atributos (métricas) relevantes, nós usamos um método chamado “Wrapper”, disponível na ferramenta Weka. Este método, pesquisa no espaço de subconjuntos de métricas e calcula a precisão estimada de um algoritmo de aprendizagem para cada métrica quando ela é adicionada ou removida do subconjunto. Usamos o algoritmo “WrapperSubSetEval” como avaliador da relevância de cada métrica e o algoritmo BestFirst como o método de pesquisa. O algoritmo “Best First” foi configurado com o parâmetro “backward”, que começa construindo o modelo com todas as variáveis e vai removendo-as conforme a performance do modelo melhora ou piora. Na média, 8,3 métricas foram selecionados pelos 5 algoritmos através das 4 releases. Para obter este resultado, o algoritmo de seleção de atributos testou na média, 281 modelos diferentes. A release 3.1 teve média de 9,4 métricas e 342,6 modelos. A release 3.2 teve média de 9,6 métricas com 242,8 modelos. As últimas duas releases (4.0 e 4.1) tiveram 9 e 5,2 métricas com 250,4 e 186,6 modelos respectivamente. As métricas mais relevantes foram a densidade da rede (density – medidas globais) e o número de comentários (propriedades globais) com 17 seleções em 20 possíveis. Logo após estas duas métricas, ego Betweenness (ego network) e número de desenvolvedores distintos que participaram da discussão (propriedades globais) foram selecionadas 11 vezes. Constraint, hierarchy (ambos structural hole) e diameter (propriedade global) foram as próximas métricas selecionadas com 10 vezes. As métricas code churn do primeiro arquivo e do segundo arquivo apareceram 8 vezes. Como estas métricas foram usadas como controle, todas as métricas abaixo delas foram consideradas menos relevantes para caracterizar as dependências de mudança fortes e fracas. É importante observar que as métricas referentes a medidas globais da rede (3 métricas) e as métricas de structural holes (2 métricas) foram mais relevantes que as métricas de ego network (uma métrica) e centrality (nenhuma seleção). Assim, encontramos evidências que indicam que o papel e a importância de um nó (desenvolvedor) são menos importantes do que a estrutura (organização) da rede. As métricas de structural hole indicam a inexistência de ligações entre dois nós na rede, o que pode indicar falhas e ausência de comunicação. 4. Conclusão e Trabalhos Futuros Dada a importância que o gerenciamento de dependências tem para a evolução do desenvolvimento do software, nós propusemos o estudo de dependências de mudança separadas em dois grupos: fortes e fracas. Durante este trabalho mostramos que é possível caracterizar a ocorrência destes dois grupos de dependência de mudança utilizando métricas extraídas da comunicação dos desenvolvedores e algoritmos de classificação. Utilizando a seleção de atributos encontramos evidências de que medidas globais da rede e métricas de structural hole são mais relevantes para a caracterização. No entanto, novos estudos são necessários para avaliar a importância das métricas de comunicação para a caracterização de dependências de mudança fortes e fracas em novos projetos. Atualmente nós estamos investigando o uso de métricas de 28 VEM código fonte e métricas do histórico de modificações de arquivos e realizando testes em novos projetos. Agradecimentos Nós gostaríamos de agradecer a Fundação Araucária, NAWEB e NAPSOL pelo suporte financeiro a esta pesquisa. Marco G. recebe apoio individual do CNPq e FAPESP. Igor W. e Gustavo Oliva recebem apoio da CAPES (Processo BEX 2039-13-3 e 250071/2013-4). Referências Ball, T., Adam, J.-M. K., Harvey, A. P. and Siy, P. (mar 1997). If Your Version Control System Could Talk... In ICSE Workshop on Process Modeling and Empirical Studies of Software Engineering. Canfora, G., Ceccarelli, M., Cerulo, L. and Di Penta, M. (2010). Using multivariate time series and association rules to detect logical change coupling: An empirical study. In Software Maintenance (ICSM), 2010 IEEE International Conference on. Canfora, G., Cerulo, L., Cimitile, M. and Penta, M. D. (2014). How changes affect software entropy: an empirical study. Empirical Software Engineering, v. 19, n. 1, p. 1–38. Cataldo, M., Mockus, A., Roberts, J. A. and Herbsleb, J. D. (2009). Software Dependencies, Work Dependencies, and Their Impact on Failures. IEEE Transactions on Software Engineering, v. 35, n. 6, p. 864–878. Conway, M. E. (1968). How do Committees Invent? Datamation, D’Ambros, M., Lanza, M. and Robbes, R. (oct 2009). On the Relationship Between Change Coupling and Software Defects. In Reverse Engineering, 2009. WCRE ’09. 16th Working Conference on. Demšar, J. (2006). Statistical Comparisons of Classifiers over Multiple Data Sets. J. Mach. Learn. Res., v. 7, p. 1–30. Gall, H., Hajek, K. and Jazayeri, M. (1998). Detection of Logical Coupling Based on Product Release History. In Proceedings of the International Conference on Software Maintenance. , ICSM ’98. IEEE Computer Society. Hall, T., Beecham, S., Bowes, D., Gray, D. and Counsell, S. (2012). A Systematic Literature Review on Fault Prediction Performance in Software Engineering. IEEE Transactions on Software Engineering, v. 38, n. 6, p. 1276–1304. Oliva, G. A. and Gerosa, M. A. (2011). On the Interplay between Structural and Logical Dependencies in Open-Source Software. In SBES. Oliva, G. A., Santana, F. W., Gerosa, M. A. and Souza, C. R. B. De (2011). Towards a classification of logical dependencies origins: a case study. In EVOL/IWPSE. Sebastiano Panichella, R. O. Gerardo Canfora Massimiliano Di Penta (2014). How the Evolution of Emerging Collaborations Relates to Code Changes: An Empirical. In IEEE International Conference on Program Comprehension (ICPC 2014). Wasserman, S. and Faust, K. (1994). Social network analysis: Methods and applications. Cambridge university press. v. 8 Ying, A. T. T., Murphy, G. C., Ng, R. and Chu-Carroll, M. C. (sep 2004). Predicting Source Code Changes by Mining Change History. IEEE Trans. Softw. Eng., v. 30, n. 9, p. 574–586. Zhou, Y., Wurch, M., Giger, E., Gall, H. and Lu, J. (2008). A Bayesian Network Based approach for change coupling prediction. In Reverse Engineering, 2008 WCRE. Zimmermann, T., Zeller, A., Weissgerber, P. and Diehl, S. (jun 2005). Mining version histories to guide software changes. Software Engineering, IEEE Transactions on, v. 31, n. 6, p. 429– 445. 29 VEM Análise de Métricas Estáticas para Sistemas JavaScript Miguel Esteban Ramos1 , Marco Tulio Valente1 1 Departamento de Ciência da Computação Universidade Federal de Minas Gerais (UFMG) – Belo Horizonte, MG – Brazil {miguel.ramos, mtov}@dcc.ufmg.br Abstract. JavaScript is a dynamic and prototype-based programming language that is being increasingly used in software development. Thanks to initiatives like Node.js, JavaScript is not anymore just a client-side language used to make DOM manipulations but turned itself into a language with all the features to implement full systems on both client and server side. Nevertheless, it is still hard to find tools and resources to analyze and verify the quality of JavaScript systems. This paper presents the results of the collection and analysis of 15 software metrics for a set of 50 JavaScript systems. Resumo. JavaScript é uma linguagem dinâmica e baseada em protótipos que cada dia é mais utilizada para o desenvolvimento de software. Graças a iniciativas como Node.js, JavaScript deixou de ser uma linguagem que só é utilizada no lado do cliente para fazer manipulações do DOM, para se tornar uma linguagem com todas as funcionalidades para implementar sistemas completos tanto do lado do cliente quanto do lado do servidor. Mesmo assim, ainda é difı́cil encontrar ferramentas e recursos que permitam analisar e verificar a qualidade de sistemas JavaScript. Neste trabalho, apresentam-se os resultados da coleta e análise de 15 métricas de software para um conjunto de 50 sistemas JavaScript. 1. Introdução JavaScript é uma linguagem de programação que atualmente está ganhando grande popularidade já que, graças à evolução que apresentou nos últimos anos e a melhorias no seu desempenho, tornou-se peça fundamental no desenvolvimento de aplicações web modernas, ricas em conteúdo, interativas e funcionais [Cantelon et al. 2014]. Além disso, a fim de levar todas as caracterı́sticas de JavaScript para outros ambientes, surgiram plataformas como Node.js que permitiram expandir o escopo de JavaScript para escrever aplicações que fazem uso intensivo de dados do lado do servidor, contribuindo para popularidade crescente da linguagem. Dado o grande número de sistemas atualmente desenvolvidos em JavaScript, é natural investigar técnicas e métodos para escrever código de qualidade nessa linguagem, fazendo uso de todos os princı́pios da Engenharia de Software. JavaScript possui um conjunto de caracterı́sticas como sua natureza dinâmica e assı́ncrona, sua orientação a protótipos, sua flexibilidade, entre outras. Essas caracterı́sticas geram novos desafios no desenvolvimento desses sistemas e fazem com que alguns conceitos tenham que ser reconsiderados ou adaptados. Finalmente, JavaScript é uma linguagem relativamente nova, sendo que ainda existem poucos estudos que procuram avaliar e aprimorar as práticas de Engenharia de Software adotadas em projetos nessa linguagem. 30 VEM Particularmente, um dos recursos mais importantes em Engenharia de Software para a análise de sistemas são métricas de software. Métricas fornecem uma grande variedade de informações, incluindo aspectos de qualidade, complexidade, manutenibilidade, tamanho, etc. Logo, métricas podem ser muito úteis no estudo das tendências e do estado da arte de sistemas JavaScript. Este trabalho analisa um conjunto de métricas calculadas para uma coleção de 50 sistemas JavaScript cujo código-fonte foi pesquisado no sistema de controle de versões GitHub. O objetivo principal é que a análise desse conjunto de dados permita-nos obter informações sobre a forma, o tamanho e a complexidade dos sistemas JavaScript, bem como analisar quais tipos de métricas estão disponı́veis para esses sistemas. O restante deste artigo está organizado conforme descrito a seguir. Na Seção 2, apresenta-se a metodologia utilizada para realizar a coleta de métricas, incluindo uma descrição da ferramenta utilizada. Na Seção 3, é apresentada a análise de resultados para três grupos de métricas. Na Seção 4, descreve-se brevemente alguns trabalhos relacionados. Na Seção 5, são apresentadas as conclusões finais do artigo. 2. Metodologia As métricas consideradas neste trabalho foram obtidas para um conjunto de 50 sistemas JavaScript escolhidos manualmente desde o sistema de controle de versão GitHub. A ferramenta utilizada para efetuar as medidas foi escomplex1 . Essa ferramenta foi escolhida depois de realizar uma busca das ferramentas atualmente disponı́veis para esse propósito e perceber que escomplex era a melhor opção por oferecer o maior número de métricas e ser a base de medição utilizada por outras ferramentas semelhantes. 2.1. Escomplex Escomplex é uma ferramenta cujo objetivo é calcular métricas de software relacionadas principalmente com a complexidade de sistemas JavaScript. Escomplex faz a medição para cada função de um arquivo JS e também oferece um conjunto de medidas para o arquivo inteiro. A fim de obter essas medidas, escomplex gera uma Árvore Sintática Abstrata (AST) do código por meio de esprima (conhecido parser JavaScript) e posteriormente caminha nessa árvore para calcular as medidas estaticamente. As métricas oferecidas por escomplex são as seguintes: • Número de módulos: Cada arquivo JS do sistema é considerado um módulo. • Linhas de código: Contagem das linhas de código fı́sicas (número de linhas en um módulo ou função) e lógicas (número de declarações imperativas). • Número de parâmetros: É o número de parâmetros obtido da assinatura de cada função. É uma medida estática e, por isso, não são levadas em consideração as funções que dependem do parâmetro arguments. • Complexidade ciclomática (CC): É a contagem do número de caminhos linearmente independentes no grafo de fluxo de controle do programa. [McCabe 1976] • Densidade de complexidade ciclomática: Proposta como uma modificação para a complexidade ciclomática, esta métrica expressa a CC como uma porcentagem do número de linhas de código lógicas [Gill and Kemerer 1991]. 1 https://github.com/philbooth/escomplex 31 VEM • Métricas de complexidade de Halstead: Conjunto de métricas que são calculadas com base no número de operadores distintos, o número de operandos distintos, o número total de operadores e o número total de operandos em cada função. Estas métricas são utilizadas para avaliar a complexidade do sistema. • Índice de manutenção: Métrica de complexidade medida numa escala logarı́tmica, calculada a partir das linhas lógicas de código, a complexidade ciclomática e o esforço Halstead [Kuipers and Visser 2007]. 2.2. Coleta de Métricas Para obter os dados de medição apresentados neste trabalho foi necessário baixar o código de 50 sistemas JavaScript e desenvolver um programa encarregado de percorrer cada um desses sistemas, realizar as medidas por meio da ferramenta escomplex e construir uma tabela onde foram registradas todas essas medidas. GitHub, o sistema de controle de versões, foi usado para pesquisar os sistemas utilizados neste trabalho e para baixar o código-fonte de cada um deles. Esse procedimento foi feito manualmente já que ainda é difı́cil encontrar um padrão utilizado globalmente nos sistemas JavaScript para a organização do código e, portanto, existe um alto risco de incluir código indesejado se o procedimento for feito automaticamente. Além disso, escolheram-se sistemas com uma alta popularidade no GitHub (maior número de stars), um número representativo de commits (pelo menos 150) e que não são uma cópia (fork) de outros projetos existentes. A Figura 1 descreve os passos que foram seguidos a fim de obter as medições para cada sistema. Figura 1. Procedimentos para coleta de métricas O primeiro passo foi criar manualmente um arquivo JSON onde se encontra um vetor cujos elementos são objetos que representam cada sistema JS e armazenam informações como o nome, a versão e a localização da pasta onde fica o código principal do projeto. Esse arquivo é então usado como um parâmetro de entrada para o bloco en32 VEM carregado do processamento de cada sistema JS e da geração da tabela com as medidas para cada um deles. O programa desenvolvido a fim de explorar cada sistema e gerar o conjunto final de dados, foi escrito em JavaScript, utilizando Node.js. Inicialmente, o programa extrai recursivamente todos os arquivos .js que compõem o sistema descartando apenas os arquivos e as pastas que não atendem às condições de um filtro proposto para evitar o processamento dos arquivos que contêm código que não pertence ao núcleo dos sistemas. Nesse último passo são excluı́dos os arquivos de produção (.min.js), arquivos de direitos autorais (copyright.js), pastas de documentação (doc, docs), pastas de testes (test), pastas de exemplos (example, examples) e pastas que incluem dependências de terceiros (thirdparty ou node modules). Posteriormente, fazendo uso da ferramenta escomplex, foram realizadas as medidas para cada arquivo JavaScript que atendeu ao filtro e contaram-se o número de arquivos que geraram erros durante esse processo (esses erros geralmente são devido a problemas de sintaxe no arquivo que está sendo processado). Por fim, nos casos de algumas métricas, calcula-se uma medida para o sistema inteiro. Por exemplo, o número de linhas de código do sistema é calculado como a soma do número de linhas de código de cada módulo; por outro lado, a complexidade ciclomática do sistema é calculada como a média desta medida para cada módulo com seu respectivo desvio padrão. Por fim, o último módulo se encarrega de percorrer o vetor onde se encontram todos os sistemas e da geração de uma tabela no formato HTML, onde são sumarizadas as medidas para cada sistema. 3. Resultados A tabela com os resultados de todas as medições realizadas para cada sistema JS, além do seu nome e a versão utilizada para a medição, estão disponı́veis no seguinte link: http://aserg.labsoft.dcc.ufmg.br/qualitas.js. A fim de analisar os resultados obtidos, usou-se o programa R. 3.1. Métricas de Tamanho A Figura 2 permite visualizar a distribuição da medida do tamanho (linhas de código) dos sistemas JS medidos. Figura 2. Linhas de cógido lógicas 33 VEM Essa distribuição mostra que a maioria dos sistemas de JS considerados neste trabalho possui um tamanho relativamente pequeno. Depois de verificar os quartis calculados para esse conjunto de dados, pode-se concluir que 75% dos sistemas têm um número de linhas de código menor ou igual a 4,85 KLOC e que o tamanho de 50% das amostras não excede a 1,3 KLOC. No boxplot da Figura 2, também pode-se notar que algumas medidas têm valores muito discrepantes correspondentes a seis amostras com número de linhas de código que vão desde 11,82 KLOC até 170,58 KLOC. Resumo dos Resultados: Embora a maior parte dos sistemas medidos neste trabalho tenha um tamanho pequeno, é possı́vel afirmar que existem também sistemas JS cujo tamanho é comparável ao de sistemas desenvolvidos em outras linguagens de programação (Java, C + +, etc) e que, portanto, JavaScript está sendo usado para desenvolver programas que vão além da manipulação do DOM do lado do cliente para aspectos de apresentação. 3.2. Métricas de Organização Modular Usando os dados coletados neste trabalho, é possı́vel vislumbrar algumas tendências existentes na organização e separação do código dos sistemas JavaScript. Hoje em dia existem vários padrões que descrevem como o código escrito em JavaScript pode ser organizado. Entre eles, o padrão de módulos é um dos mais populares. Os gráficos da Figura 3 apresentam a distribuição do número de módulos e o número de funções por módulo dos sistemas considerados no presente trabalho. Figura 3. Módulos e funções por módulos Um dos aspectos que chama atenção nos gráficos da Figura 3 é que o primeiro quartil da medida é igual a 1. Isso significa que pelo menos 25% dos sistemas são implementados em um único arquivo (módulo). No entanto, também é possı́vel observar que metade dos sistemas apresentam mais de 13 módulos. Além disso, os três maiores sistemas possuem 403, 539 e 574 módulos. Ao realizar uma análise isolada do número de linhas de código dos sistemas que foram implementados em um único módulo, encontrou-se que 75% desses sistemas têm menos de 0.93 KLOC e que nenhum deles possui mais de 1.47 KLOC. No que se refere àqueles sistemas com mais de 13 módulos, 75% desses sistemas têm mais de 2.28 KLOC. Após o cálculo do coeficiente de Spearman, cujo resultado foi de 0.84, determinou-se que existe uma correlação forte entre o número de módulos e o número de linhas de código de cada sistema. 34 VEM Além disso, no que diz respeito ao número de funções por módulo, os resultados mostram que 50% dos sistemas têm uma média menor do que 14,4 funções por módulo. Por outro lado, 25% dos sistemas têm mais do que 36,6 funções por módulo, o que a princı́pio é um número alto. Após a realização de uma verificação manual na tabela de resultados, foi possı́vel confirmar que a maioria dos sistemas incluı́dos nesse 25% corresponde a sistemas que foram implementados em um único módulo. Resumo dos Resultados: Os resultados mostram que, quando se trata de sistemas pequenos, é muito provável que esses sejam implementados em um único arquivo JavaScript. No entanto, à medida que aumenta o tamanho dos sistemas, o código tende a ter uma melhor modularização. 3.3. Métricas de Complexidade Os gráficos da Figura 4 mostram as distribuições das medidas de complexidade ciclomática e ı́ndice de manutenibilidade. Figura 4. Complexidade ciclomática e Índice de manutenção O terceiro quartil da medida de complexidade mostra que 75% dos sistemas considerados neste trabalho apresentam uma complexidade ciclomática menor que 66,69. Levando em consideração que, segundo Alves et al. [Alves et al. 2010], apenas métodos com medidas de complexidade acima de 14 deveriam ser considerados de alto risco para sistemas Java, e que uma classe tı́pica em Java possui cerca de 10 métodos (o que deixa esse limite em 140 por classe), podemos concluir que complexidades ciclomáticas médias menores que 66,69 não representam uma medida alta. Somente três dos sistemas avaliados apresentaram medidas maiores do que 200. Por outro lado, no que se refere a medida de ı́ndice de manutenibilidade, todos os sistemas apresentam um valor maior que 90 para essa medida. Assim, considerando os limites apresentados em [Coleman et al. 1994], todos os sistemas medidos apresentaram uma alta manutenibilidade ( ≥ 85 ). Isso não faz muito sentido já que ı́ndices de manutenibilidade mais baixos deveriam ter sido obtidos pelo menos para aqueles sistemas que apresentam uma altı́ssima complexidade ciclomática ou uma grande quantidade de funções por módulo. Uma crı́tica semelhante ao ı́ndice de manutenibilidade é feita em [Fard and Mesbah 2013], dado que não se encontrou uma relação entre a má qualidade de código (code smells) e o ı́ndice de manutenibilidade de cada sistema. Outra discussão sobre problemas com esta métrica é apresentada em [Kuipers and Visser 2007]. 35 VEM Resumo dos Resultados: Para a grande maioria dos sistemas JavaScript analisados, as medidas de complexidade ciclomática são adequadas, pelo menos quando contrastadas com aquelas normalmente aceitas em sistemas Java. Por outro lado, no caso do ı́ndice de manutenibilidade, os resultados são menos conclusivos, reforçando as crı́ticas a essa métrica encontradas na literatura. 4. Trabalhos Relacionados Atualmente, existe um pequeno grupo de ferramentas usadas para medições de software em sistemas JavaScript. A maioria dessas ferramentas, como escomplex, estão focadas na análise de complexidade. Plato2 é uma das ferramentas mais populares, pois faz uso de complexityReport.js3 e JShint4 para calcular métricas e gerar um relatório completo via gráficos interativos, que permitem comparações entre as medidas de cada módulo. JSNose [Fard and Mesbah 2013] apresenta uma técnica para detecção de code smells que combina análise estática e dinâmica, a fim de encontrar padrões no código que possam resultar em problemas de compreensão e manutenção. Adicionalmente, são propostas algumas métricas alternativas para sistemas JavaScript, mas apenas é mostrado o resultado de cinco medidas feitas para 11 sistemas, fazendo uso da ferramenta complexityReport.js. Finalmente, uma análise da correlação entre o número de code smells detectados e as medições efetuadas em todos os sistemas é realizada. 5. Conclusão Estudos similares aos reportados neste artigo existem para outras linguagens, notadamente Java [Baxter et al. 2006] e [Terra et al. 2013]. No entanto, no melhor de nosso conhecimento, este artigo reporta o mais extenso estudo realizado até o momento com o objetivo de caracterizar o comportamento estático de sistemas JavaScript, uma das linguagens mais populares atualmente. Como uma segunda contribuição, temos a disponibilização pública de um dataset de sistemas nessa linguagem, inspirado em datasets largamente utilizados em estudos empı́ricos envolvendo linguagens estáticas, como Java [Terra et al. 2013] e [Tempero et al. 2010]. Após a análise dos dados foram encontrados os seguintes resultados principais: (a) apesar de existirem ainda pequenos sistemas JavaScript, já existem também sistemas cujo grande tamanho sugere que são programas que vão além de pequenos scripts utilizados para manipulação do DOM; (b) no que se refere a modularidade, encontrou-se que aqueles sistemas pequenos são implementados inteiramente em um só módulo (arquivo) e que, somente aqueles de maior tamanho apresentam uma melhor distribuição do código fazendo uso de um maior número de módulos; (c) com relação às medidas de complexidade ciclomática, mostrou-se que a grande maioria dos sistemas JavaScript possuem valores adequados para essa medida quando comparados com valores comumente aceitos e praticados em sistemas Java. Trabalhos futuros podem incluir um número maior de sistemas, adição de mais métricas utilizando ferramentas de medição de software alternativas, incluindo métricas que considerem também o comportamento dinâmico de sistemas JavaScript. Pretendemos 2 https://www.npmjs.org/package/plato https://www.npmjs.org/package/complexity-report 4 http://jshint.com/ 3 36 VEM também investigar valores de referência (thresholds) para essas métricas, usando a técnica proposta por Oliveira et al. [Oliveira et al. 2014]. Por fim, pretendemos trabalhar em uma versão histórica do dataset proposto, com dados de evolução dos sistemas JavaScript, a exemplo do que ocorre com datasets já disponibilizados para Java [Couto et al. 2013]. Agradecimentos Esta pesquisa foi apoiada pelo PEC-PG - CNPq e FAPEMIG Referências Alves, T. L., Ypma, C., and Visser, J. (2010). Deriving metric thresholds from benchmark data. In 2010 IEEE International Conference on Software Maintenance (ICSM), pages 1–10. IEEE. Baxter, G., Frean, M., Noble, J., Rickerby, M., Smith, H., Visser, M., Melton, H., and Tempero, E. (2006). Understanding the shape of Java software. In 21th Conference on Object Oriented Programming, Systems, Languages and Applications (OOPSLA), pages 397–412. Cantelon, M., Holowaychuk, T., Rajlich, N., and Harter, M. (2014). Node. js in Action. Manning Publications. Coleman, D., Ash, D., Lowther, B., and Oman, P. (1994). Using metrics to evaluate software system maintainability. Computer, 27(8):44–49. Couto, C., Maffort, C., Garcia, R., and Valente, M. T. (2013). COMETS: A dataset for empirical research on software evolution using source code metrics and time series analysis. ACM SIGSOFT Software Engineering Notes, pages 1–3. Fard, A. M. and Mesbah, A. (2013). Jsnose: Detecting javascript code smells. In IEEE 13th International Working Conference on Source Code Analysis and Manipulation (SCAM), pages 116–125. IEEE. Gill, G. K. and Kemerer, C. F. (1991). Cyclomatic complexity density and software maintenance productivity. IEEE Transactions on Software Engineering, 17(12):1284– 1288. Kuipers, T. and Visser, J. (2007). Maintainability index revisited–position paper. In Special Session on System Quality and Maintainability (SQM 2007) of the 11th European Conference on Software Maintenance and Reengineering (CSMR 2007). McCabe, T. J. (1976). A complexity measure. IEEE Transactions on Software Engineering, SE-2(4):308–320. Oliveira, P., Valente, M. T., and Lima, F. (2014). Extracting relative thresholds for source code metrics. In IEEE Conference on Software Maintenance, Reengineering and Reverse Engineering (CSMR-WCRE), pages 254–263. Tempero, E., Anslow, C., Dietrich, J., Han, T., Li, J., Lumpe, M., Melton, H., and Noble, J. (2010). The Qualitas corpus: A curated collection of Java code for empirical studies. In Asia-Pacific Software Engineering Conference (APSEC), pages 336–345. Terra, R., Miranda, L. F., Valente, M. T., and Bigonha, R. S. (2013). Qualitas.class Corpus: A compiled version of the Qualitas Corpus. Software Engineering Notes, pages 1–4. 37 VEM Migração Parcial de um Banco de Dados Relacional para um Banco de Dados NoSQL na Nuvem Através de Adaptações Não-intrusivas: Um Relato de Experiência Caio H. Costa1 , Lincoln S. Rocha2 , Nabor C. Mendonça3 , Paulo Henrique. M. Maia1 1 Mestrado Acadêmico em Ciências da Computação (MACC) Universidade Estadual do Ceará (UECE) Campus do Itaperi, Av. Paranjana, 1700, CEP 60740-903 Fortaleza - CE 2 Universidade Federal do Ceará (UFC) Campus de Quixadá, Av. José de Freitas Queiroz, 5002, CEP 63900-00 Quixadá - CE 3 Programa de Pós-Graduação em Informática Aplicada (PPGIA) Universidade de Fortaleza (UNIFOR) Av. Washington Soares, 1321, Edson Queiroz, CEP 60811-905 Fortaleza - CE [email protected], [email protected], [email protected], [email protected] Abstract. This paper reports the experience of partially migrating the relational database of a legacy system to a NoSQL database in the cloud in order to resolve performance issues. Part of the relational database data was adapted and migrated to the NoSQL database. The adaptations of the two applications that make up the system were performed using a non-intrusive approach based on aspect-oriented programming and dynamic features of the Groovy programming language. After the necessary adjustments, the system became able to simultaneously access the relational database and the new DynamoDB database on Amazon cloud. Resumo. Este trabalho relata a experiência de migração parcial do banco de dados relacional de um sistema legado para um banco de dados NoSQL na nuvem, a fim de solucionar problemas relacionados a desempenho. Parte dos dados do banco de dados relacional foi adaptada e migrada para o banco de dados NoSQL. As adaptações das duas aplicações que compõem o sistema foram realizadas por meio de uma abordagem não-intrusiva baseada em programação orientada a aspectos e funcionalidades dinâmicas da linguagem de programação Groovy. Após as adaptações necessárias, as duas aplicações passaram a acessar simultaneamente a base de dados relacional e a nova base de dados DynamoDB, na nuvem da Amazon. 1. Introdução Este trabalho relata a migração parcial da base de dados relacional de uma aplicação legada para um banco de dados NoSQL na nuvem, a fim de solucionar problemas de desempenho oriundos do crescimento exponencial da sua maior, e mais importante, tabela. Trata-se de um sistema de monitoramento veicular composto de duas aplicações: uma web, chamada RastroBR, e outra standalone, chamada RBRDriver. 38 VEM Ambas as aplicações compartilham o conceito de posição na descrição dos seus domı́nios. Uma posição caracteriza a localização georeferenciada de um veı́culo monitorado pelo sistema. Os dados relativos à posição do veı́culo são enviados a uma base de dados em intervalos fixos de um minuto. Como consequência do contı́nuo aumento no número de veı́culos monitorados, o volume de dados armazenados na tabela posicao passou a crescer em uma taxa exponencial. Desse modo, em conseqüência do tamanho1 e do rápido crescimento da tabela posicao, operações de consulta e de inserção de registros nessa tabela tonaram-se cada vez mais lentas. Para amenizar esse problema, um escalonamento vertical no servidor de banco de dados foi realizado algumas vezes. Porém, além dessa ser uma solução cara, ela apresenta limites práticos de implementação. De acordo com [Sadalage and Fowler 2013], bancos de dados relacionais não foram projetados para serem escalonados horizontalmente. Já os bancos de dados NoSQL orientados a agregados, por outro lado, foram projetados para lidar com grandes volumes de dados por meio do escalonamento horizontal. Desse modo, uma alternativa baseada em um banco de dados NoSQL tornou-se a mais viável para o problema descrito. Uma vez que o banco de dados NoSQL DynamoDB [Sivasubramanian 2012], na nuvem da Amazon, foi escolhido, era necessário adequar e migrar os dados da tabela posicao para uma coleção do DynamoDB e adaptar as duas aplicações que compõem o sistema para que ambas passassem a trabalhar com o DynamoDB. Porém, essa solução deveria ser utilizada apenas para a entidade posição. Todas as outras entidades deveriam continuar na base de dados relacional por causa das restrições de integridade que não são oferecidas em bases de dados NoSQL, além das mesmas não darem suporte a relacionamentos entre coleções. Além disso, a adaptação das aplicações deveria ser realizada da forma menos intrusiva possı́vel a fim de evitar a inserção de erros e facilitar o trabalho dos desenvolvedores que não conheciam bem a arquitetura do sistema. O restante do artigo está dividido da seguinte forma: a Seção 2 discute os principais trabalhos relacionados; a Seção 3 apresenta a arquitetura das duas aplicações que compõem o sistema; a Seção 4 descreve a migração dos dados da tabela posicao para uma coleção no DynamoDB; a adaptação das duas aplicações é relatada na Seção 5; por fim, a Seção 6 traz as conclusões e sugestões de trabalhos futuros. 2. Trabalhos Relacionados Em [Jamshidi et al. 2013], uma revisão sistemática identifica 23 pesquisas focadas em migrações de aplicações legadas para a nuvem. Os autores classificam as migrações em: substituição, parcial, pilha completa, e “cloudificação”. De acordo com essa classificação, a migração que o relato de experiência deste trabalho aborda é caracterizada como uma migração por substituição. Nenhuma das pesquisas que fizeram parte da revisão sistemática em [Jamshidi et al. 2013] é caracterizada como tal. Lições aprendidas durante a transição de uma grande base de dados relacional para um modelo hı́brido, que combina um banco de dados relacional e um banco de dados NoSQL, são relatadas em [Schram and Anderson 2012]. O sistema abordado nesse trabalho é composto de serviços e foi adaptado de forma pouco intrusiva, pois a composição 1 Durante o perı́odo de escrita deste artigo, o tamanho da tabela posicao era, aproximadamente, 110GB. 39 VEM dos serviços era realizada por meio da injeção de dependência do framework Spring, injetando em tempo de execução implementações concretas em referências de tipos abstratos. A aplicação RastroBR realiza injeção de dependência por meio do framework Spring, porém sua adaptação foi realizada utilizando aspectos para que a modificação fosse mais granular e pontual. Em [Vu and Asal 2012] é realizada uma análise das principais plataformas de nuvem do mercado. Três exemplos de migração de aplicações são apresentados. A diferença entre os exemplos apresentados em [Vu and Asal 2012] para o relato deste trabalho é que em [Vu and Asal 2012] todas as modificações foram realizadas de forma intrusiva, uma vez que não se tratava de uma aplicação comercial em produção. O trabalho [Chauhan and Babar 2011] relata a migração por pilha completa [Jamshidi et al. 2013] da ferramenta Hackystat para a nuvem. Os serviços que compõem a ferramenta foram implantados separadamente em instâncias da nuvem Amazon EC2 que utilizam o recurso de elasticidade. Os autores concluem que sistemas que dividem a lógica do negócio entre aplicação e base de dados, por meio de gatilhos e outras funcionalidades, são mais difı́ceis de migrar porque a nuvem deve oferecer um banco de dados que possibilite que as mesmas estruturas possam ser executadas. Essa é uma das razões que fez com que a migração da base de dados das aplicações RBRDriver e RastroBR fosse parcial, pois a mesma contém gatilhos que fazem parte da lógica do negócio. Os autores em [Vasconcelos et al. 2013] propõem uma abordagem não-intrusiva baseada em eventos para adaptar o código de uma aplicação legada para o ambiente de nuvem levando em conta as restrições dessa nova plataforma. Nessa abordagem, o código fonte da aplicação é interceptado usando, por exemplo, programação orientada a aspectos, e seu fluxo de execução é direcionado para um serviço similar na nuvem através da utilização de um middleware baseado em eventos. Como prova de conceito, os autores sugerem a utilização de aspectos para interceptar a persistência de arquivos em disco e armazená-los na nuvem sem modificar o código legado da aplicação. A adaptação relatada neste trabalhou foi baseada nessa idéia, porém os aspectos foram utilizando para desviar a persistência de dados de uma base de dados relacional para uma base de dados NoSQL na nuvem. 3. Arquitetura do Sistema O RBRDriver é uma aplicação standalone, escrita em Groovy [König et al. 2007], cuja principal função é decodificar os pacotes enviados pelos veı́culos monitorados e persistir suas posições na base de dados, além de enviar comandos e configurações para os equipamentos instalados nos veı́culos. Cada posição decodificada é inserida como um registro na tabela posicao no SGBD relacional PostgreSQL. O RBRDriver utiliza o padrão DAO, em combinação com o padrão Abstract Factory, para interagir com a base de dados. A classe PositionCodec é responsável por decodificar e persistir os dados recebidos. Essa classe possui uma referência do tipo DaoFactory, uma interface, e requisita a ela objetos DAO para consultar dados e persistir as posições dos veı́culos na tabela posicao. O tipo concreto da fábrica de objetos DAO, a referência do tipo DaoFactory, é definido em um arquivo de configuração. Nesse arquivo é definida a classe SqlFactory 40 VEM como fábrica de objetos DAO. Portanto, todo objeto DAO retornado por objetos DaoFactory são DAOs especı́ficos para interagir com bancos de dados relacionais. Não é possı́vel alterar essa configuração para que uma implementação de fábrica especifica para uma base de dados NoSQL em particular seja utilizada. Dessa maneira, toda a famı́lia de objetos DAO seria alterada. Isso não é interessante porque, além de persistir as localizações dos veı́culos, a aplicação também executa outras funções, como envio de comandos e configurações, e os dados necessários para a execução dessas funções necessitam dos relacionamento e integridade oferecidos pela base de dados relacional. O RastroBR é uma aplicação web que permite que os usuários acompanhem o deslocamento dos veı́culos, mantenham os cadastros de clientes, usuários e veı́culos, e obtenham relatórios de deslocamento e estatı́sticas. Assim como o RBRDriver, o RastroBR utiliza o padrão DAO em conjunto com o padrão Abstract Factory para implementar a camada de acesso ao banco de dados. No RastroBR as classes DAO utilizam o framework GORM [Fischer 2009], sendo esse, por sua vez, implementado sobre os frameworks Spring e Hibernate. Figura 1. Interfaces e classes DAO, do RastroBR, relacionadas à consulta de posições. Os relatórios oferecidos pelo RastroBR aplicam regras de negócio sobre registros da tabela posicao, tendo seus desempenhos afetados por ela. As classes de serviço dos relatórios possuem uma referência cujo tipo é a interface DaoFactory, por meio da qual obtêm as classes DAO para interagir com a base de dados. Através da capacidade de injeção de dependência do framework Spring, a classe concreta que implementa a interface DaoFactory pode ser facilmente trocada por meio de um script de configuração. Em tempo de execução, a referência do tipo PosicaoDao obtida é um objeto do tipo GormPosicaoDao que consulta as posições da tabela posicao para criar os relatórios requisitados (Figura 1). 4. Migração dos dados O banco de dados escolhido, o DynamoDB, é um banco de dados NoSQL orientado a agregados [Sadalage and Fowler 2013]. O conceito de agregado é bastante apropriado para a arquitetura escalonada horizontalmente. Um agregado informa ao banco de dados quais dados devem ser tratados como uma única unidade indivisı́vel, e, por isso, os mesmos devem ser mantidos em um mesmo servidor. No entanto, dois agregados diferentes, mesmo sendo de uma mesma coleção, não precisam ser mantidos em um mesmo servidor. 41 VEM A ausência de relacionamentos entre agregados, como aqueles mantidos por meio de chaves estrangeiras em bancos de dados relacionais, propicia a divisão dos dados entre vários nós. Porém, por causa dessa caracterı́stica, não é possı́vel, em uma única consulta, realizar junções entre agregados de coleções diferentes. A persistência dos dados do sistema dependia do relacionamento entre entidades oferecido pelo modelo relacional. Figura 2. Adaptação dos dados da tabela posicao para uma coleção NoSQL. Apesar de sua importância, a tabela posicao armazena apenas dados históricos que não são editados. Essa particularidade permitiu adaptar seus dados para uma coleção NoSQL. A adequação dos dados foi realizada unindo em um único agregado cada registro da tabela posicao com os registros de outras tabelas referenciados pelas chaves estrangeiras dela2 . Assim, os agregados da coleção resultante fornecem, em apenas uma consulta, todos os dados necessários para a emissão dos relatórios do sistema. A Figura 2 mostra, de forma simplificada3 , a tabela posicao referenciando outras tabelas, e como seus dados foram adaptados para uma coleção trazendo os dados dos registros referenciados para junto dos registros da própria tabela, criando um agregado. 5. Adaptação do Sistema Para utilizar técnicas de programação orientada a aspectos na adaptação da aplicação RastroBR, foi utilizado o framework Spring AOP (Aspect Oriented Programming). No Spring AOP, os aspectos são implementados utilizando classes Java comuns. É possı́vel indicar ao framework quais classes implementam aspectos utilizando XML em um arquivo de configuração, e nas classes, especificar os joint points e advices por meio de annotations. A estratégia adotada foi criar um aspecto contendo um advice do tipo around, que intercepta o método getPosicaoDao da interface DaoFactory e retorna uma implementação DAO apropriada para o DynamoDB, ao invés de uma implementação para um banco de dados relacional, como em todo o resto da aplicação. No RastroBR, uma implementação da interface DaoFactory é injetada nos serviços utilizando a injeção de dependência do Spring e, quando esses requisitam um DAO, obtêm DAOs de uma mesma famı́lia, no caso, implementações para um banco de dados relacional. 2 3 O escopo deste trabalho não aborda as consequências referentes à perda de normalização dos dados. Os demais campos das tabelas não são exibidos por serem dispensáveis para o entendimento da solução. 42 VEM Para modificar esse comportamento foi implementado um advice apenas para as classes de serviços relacionadas aos relatórios que dependem da tabela posicao. Esse advice intercepta o pointcut correspondente à chamada de método que retorna um DAO da entidade posicao, e, ao invés de retornar uma classe que faça parte da famı́lia de classes definida pela injeção de dependência, retorna uma implementação própria para interagir com a coleção posicao no banco DynamoDB, mas que também implementa a interface PosicaoDao. Um trecho de código do aspecto que contém esse advice é exibido na Figura 3. A linha 13 exibe o pointcut que intercepta a chamado ao método getPosicaoDao da interface DaoFactory, e a linha 15 retorna uma implementação DAO para o DynamoDB. Figura 3. Advice retorna um DAO DynamoDB ao invés de uma DAO relacional. Com a implementação do aspecto contendo o advice exibido na Figura 3, um objeto da classe RelatorioService chama o método getPosicaoDao da interface DaoFactory para consultar a a tabela posicao. Nesse momento, um advice da classe DaoFactoryAspect intercepta essa chamada e, ao invés do fluxo normal acontecer, que seria a classe Factory (que implementa a interface DaoFactory) retornar uma instância de acordo com sua famı́lia, por exemplo um GormPosicaoDao, o aspecto retorna para a classe cliente uma instância do tipo DynamoDbPosicaoDao. A classe DynamoDbPosicaoDao também implementa a interface PosicaoDao e é com essa interface que a classe cliente, RelatorioService, interage. Portanto, não houve nenhuma incompatibilidade e o código da classe RelatorioService não necessitou de alterações. Para que o aspecto seja ativado, passando a interceptar os pointcuts que foram especificados em seus advices, é necessário indicar para Spring AOP quais classes são aspectos. Isso é feito através da definição do bean no script de configuração dos Spring beans da aplicação. Semelhantemente ao RastroBR, no RBRDriver foi implementado um aspecto, utilizando AspectJ [Kiselev 2002], contendo um advice do tipo around, para capturar as chamadas ao método getPosicaoDao da interface DaoFactory. No entanto, o advice do aspecto estava sendo executado diversas vezes ao invés de ser executado apenas uma vez para cada chamada ao método getPosicaoDao da interface DaoFactory. As funcionalidades dinâmicas da linguagem Groovy não permitiam o funcionamento correto do aspecto. O artigo [McClean 2006]4 apontou uma solução. Em uma aplicação Groovy, para cada classe carregada na memória existe uma metaclasse correspondente que possui todas 4 MCCLEAN, J. Painless AOP with Groovy. InfoQueue, 2 October 2006. ¡http://www.infoq.com/articles/aop-with-groovy¿. Acesso em: 27 Janeiro 2014.. 43 Disponivel em: VEM as propriedades e métodos da classe à qual ela está relacionada. De acordo com o protocolo que rege as chamadas de método em aplicações Groovy, uma chamada de método para um objeto é direcionada para uma instância da metaclasse deste objeto, ao invés do objeto propriamente dito. Groovy permite trocar a metaclasse de uma classe em tempo de execução, alterando dinamicamente o comportamento de todas as instâncias dessa classe. Dessa maneira, é possı́vel alterar dinamicamente o comportamento de uma classe sem modificar seu código fonte. Uma das maneiras de fazer isso é pôr a metaclasse substituta, nomeada de forma adequada, em um pacote especı́fico, cujo nome e posição na hierarquia de pacotes depende da classe cuja metaclasse será substituı́da. Como qualquer classe Groovy, a classe SqlPosicaoDao, responsável por salvar as posições dos veı́culos na tabela posicao, possui uma metaclasse com cópias de todos os seus métodos e propriedades. Para cada método chamado na classe SqlPosicaoDao, na realidade, o método equivalente é chamado na metaclasse. Ou seja, quando o método save é chamado na classe SqlPosicaoDao, o que realmente acontece é uma chamada ao método invokeMethod na metaclasse de SqlPosicaoDao, que por sua vez chama o método save da metaclasse. Portanto, era necessário substituir a metaclasse padrão fornecida pelo compilador por uma metaclasse com uma implementação adequada para o DynamoDB. Isso foi realizado através do método citado anteriormente, a substituição da metaclasse padrão da classe SqlPosicaoDao por meio da adição de uma nova metaclasse, no pacote apropriado, no classpath da aplicação. A nova metaclasse foi nomeada SqlPosicaoDaoMetaClass e foi colocada no pacote groovy.runtime.metaclass.com.azultecnologia.dao.sql seguindo o padrão necessário para que a substituição da metaclasse padrão ocorra. Na metaclasse substituta foi implementado um código que utilizasse o DAO DynamoDbPosicaoDao para armazenar a posição no banco de dados DynamoDB e retornar o mesmo valor que seria retornado pelo método save da classe SqlPosicaoDao. Depois da alteração, ao chamar o método save da classe SqlPosicaoDao, o método invokeMethod da nova metaclasse é executado e a classe DynamoDbPosicaoDao é utilizada para armazenar a posição. Por fim, o número de posições armazenadas é retornado. Assim, um efeito semelhante a um advice do tipo around é obtido. 6. Conclusões A utilização de aspectos para adaptar a aplicação RastroBR, como sugerido em [Vasconcelos et al. 2013], para modificar aplicações de forma não intrusiva, se mostrou valiosa. A AOP foi utilizada não para tratar um interesse que permeia toda a aplicação, mas apenas a persistência de um domı́nio em uma base de dados alternativa. Essa abordagem pode ser utilizada para tratar diversos outros casos onde seja necessário adaptar código de aplicações de forma não intrusiva. É difı́cil adaptar uma aplicação para que toda a sua base de dados relacional seja migrada para um banco de dados NoSQL. De acordo com [Sadalage and Fowler 2013], quando uma aplicação utiliza um banco de dados NoSQL, seu domı́nio deve ser projetado desde o inı́cio tendo em mente as caracterı́sticas desse tipo de banco de dados. Bases de dados NoSQL não possuem muitos dos recursos de relacionamento entre entidades e inte44 VEM gridade que os arquitetos já possuem em mente no momento em que projetam o domı́nio de uma aplicação. Porém, como visto neste relato de experiência, em alguns casos, é possı́vel migrar parte dos dados quando estes apresentam caracterı́sticas que permitam uma adaptação. As metaclasses Groovy foram utilizadas de forma muito semelhante a aspectos, a fim de alcançar o objetivo de modificar a aplicação de forma não-intrusiva. As funcionalidades dinâmicas da linguagem Groovy podem ser utilizadas como aspectos em aplicações Groovy, evitando a adição de mais um framework na aplicação. Pretendemos, como trabalho futuro, aplicar as técnicas utilizadas na migração relatada neste artigo com outras soluções de bancos de dados NoSQL e realizar um comparativo relacionado a desempenho, facilidade de implementação, gerenciamento oferecido pela nuvem, entre outros. Outro trabalho interessante é utilizar apenas as funcionalidades da linguagem Groovy para capturar os pontos de interesse das aplicações e comparar essa abordagem com a que utiliza programação orientada a aspectos. Referências Chauhan, M. A. and Babar, M. A. (2011). Migrating service-oriented system to cloud computing: An experience report. In 2011 IEEE 4th International Conference on Cloud Computing, pages 404–411. IEEE. Fischer, R. (2009). Grails Persistence with GORM and GSQL. Apress, 1st edition. Jamshidi, P., Ahmad, A., and Pahl, C. (2013). Cloud migration research: A systematic review. IEEE Transactions on Cloud Computing, 1(2):142–157. Kiselev, I. (2002). Aspect-Oriented Programming with AspectJ. Sams, 1st edition. König, D., Laforge, G., King, P., Champeau, C., D’Arcy, H., Pragt, E., and Skeet, J. (2007). Groovy In Action. Manning Publications Co., 1st edition. Sadalage, P. J. and Fowler, M. (2013). NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence. Pearson Education, 1st edition. Schram, A. and Anderson, K. M. (2012). Mysql to nosql: data modeling challenges in supporting scalability. In SPLASH 12 Proceedings of the 3rd annual conference on Systems, programming, and applications: software for humanity, pages 191–202. ACM. Sivasubramanian, S. (2012). Amazon dynamodb: a seamlessly scalable non-relational database service. In SIGMOD ’12 Proceedings of the 2012 ACM SIGMOD International Conference on Management of Data, pages 729–730. ACM. Vasconcelos, M. A., Barbosa, D. M., Maia, P. H. M., and Mendonça, N. C. (2013). Uma abordagem baseada em eventos para adaptação automática de aplicações para a nuvem. In VEM 2013: I Workshop Brasileiro de Visualização, Evolução e Manutenção de Software. Vu, Q. H. and Asal, R. (2012). Legacy application migration to the cloud: Practicability and methodology. In 2012 IEEE Eighth World Congress on Services, pages 270–277. IEEE. 45 VEM Polimorphic View: visualizando o uso de polimorfismo em projetos de software Fabio Petrillo1 , Guilherme Lacerda12 , Marcelo Pimenta1 e Carla Freitas1 1 Instituto de Informática – Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15.064 – 91.501-970 – Porto Alegre – RS – Brazil 2 Faculdade de Informática - Centro Universitário Ritter dos Reis (Uniritter) Rua Orfanotrófio, 555 – 90840-440 – Porto Alegre – RS – Brazil {fspetrillo,gslacerda,mpimenta,carla}@inf.ufrgs.br Abstract. Polymorphism is a powerful and flexible programming mechanism, being one of the key concepts for object-oriented software design and development. Nevertheless, polymorphism has a dark side: if it is used improperly, it can ruin application understandability. Despite its importance, very little attention has been paid to how it is used in software projects, especially because it is very difficult to find and visualize where - in source code or specifications polymorphism is adopted. In this paper, we discuss how polymorphism is used and propose an approach to explicit the polymorphism usage by representing the software as a static call graph. 1. Introdução O processo de manutenção de software é uma atividade complexa [Lange and Nakamura 1997] e a maior parte do tempo gasto neste processo é dedicado à compreensão do sistema a ser modificado [Caserta and Zendra 2010]. Compreender as dependências entre os diferentes componentes de um software é uma das tarefas mais importantes e desafiadoras em engenharia de software [Hoogendorp 2010]. Consequentemente, a criação de um projeto claro e compreensı́vel, a fim de apoiar a manutenção de sistemas orientados a objetos (OO) é uma preocupação vital para a indústria de software [Mihancea 2009]. Neste contexto, o polimorfismo é um conceito chave na programação OO[Mihancea 2009] [Ponder and Bush 1994], sendo, provavelmente, o seu mecanismo mais poderoso e flexı́vel[Ambler 1995] [Booch et al. 2007]. Polimorfismo oferece benefı́cios como maior extensibilidade e reutilização [Benlarbi and Melo 1999]. Por consequência, a caracterização dos projetos de software com respeito à maneira como eles usam o polimorfismo é importante tanto para a compreensão de software quanto na avaliação da sua qualidade [Mihancea 2009]. Entretanto, apesar de importante, pouco se sabe sobre como polimorfismo é usado em projetos de software, especialmente porque é difı́cil de encontrar e visualizar sua adoção. Este trabalho tem como objetivo apresentar uma abordagem para a investigação do uso de polimorfismo em projetos de software. Em particular, este artigo aborda os efeitos na invocação de métodos, destacando chamadas polimórficas através da análise estática de software, mostrando a maneira pelo qual os clientes de uma classe com métodos abstratos fazem uso de polimorfismo. Para alcançar este objetivo, foram analisados dois 46 VEM projetos desenvolvidos em Java, utilizando uma visualização que torna explı́cito o uso de polimorfismo através de um grafo de chamadas estáticas, denominado Polymorphic View. Este artigo está organizado da seguinte forma: inicialmente, a seção 2 faz-se uma breve contextualização do problema e a apresenta a visualização proposta. A seção 3 descreve a análise de dois projetos desenvolvidos em Java e a seção 4 apresenta os trabalhos relacionados. Finalmente, a seção5 sumariza as contribuições e descreve algumas possibilidades de trabalhos futuros. 2. Visualizando o Polimorfismo Esta seção apresenta uma abordagem para visualização do uso de polimorfismo. Inicialmente, contextualizamos o problema, com a descrição de um exemplo, com diagramas da UML. Em seguida, descrevemos a representação proposta. Figure 1. Um exemplo de polimorfismo 2.1. Contextualizando o problema Um exemplo tı́pico de polimorfismo é ilustrado no diagrama de classes da Figura 1. Esse diagrama é uma adaptação do modelo apresentado por Booch et al. [Booch et al. 2007]. Nesse exemplo, a interface Drawable é implementada pela classe abstrata Shape e pela classe concreta Line. Shape tem duas subclasses: Circle e Rectangle. Consequentemente, em um programa Java, Line, Circle e Rectangle implementam um método chamado draw(). A classe Plotter é um cliente das implementações de Drawable, instanciando objetos do tipo Drawable e fazendo uma invocação polimórfica, chamando o método draw(). Figure 2. Diagrama de sequência para o exemplo de polimorfismo Em UML, o diagrama de sequência é usado para descrever um conjunto de interações entre objetos [Dutoit and Bruegge 2010]. No diagrama de sequência, para explicitar o polimorfismo, é necessário usar vários diagramas, sendo um para apresentar a mensagem polimórfica para as classes abstratas e outros diagramas para 47 VEM detalhar o uso do polimorfismo, iniciando com a mensagem polimórfica [Larman 2004]. Outra possibilidade é o uso comentários ou anotações no diagrama, como pode ser visto na Figura 2. Nesse exemplo, as instâncias de Drawable não são explicitamente representadas e a invocação polimórfica do método draw() pode não ser claramente observada, necessitando de comentários para esclarecer o uso do polimorfismo. Portanto, mesmo em um exemplo simples, não é trivial visualizar invocações polimórficas utilizando diagramas da UML. Finalmente, três artefatos (código, diagramas de classe e de sequência) são necessários para visualizar e compreender o uso de polimorfismo. Com o objetivo de tratar essas questões, propomos uma abordagem para explicitar o uso de polimorfismo em um só diagrama através de uma representação em grafo de chamadas estáticas. 2.2. Polymorphic View O Polymorphic View é uma representação para modelagem de software baseado em grafo orientado de chamadas [Grove et al. 1997] para explicitar o uso de polimorfismo. Ele consiste nos seguintes elementos básicos: Tipos: representado por um retângulo com bordas arredondadas (Figura 3), usado para representar classes e tipos. Tipos concretos (ou Figure 3. Tipos Concreto, Abstrato e Interface instanciáveis) são representados como retângulos com linhas sólidas, enquanto tipos abstratos e interfaces (não instanciáveis) são representados com linhas tracejadas. Como na UML, os tipos abstratos tem seu rótulo em itálico. Somente tipos que tem código fonte disponı́vel são representados, pertencentes ao domı́nio da aplicação. Invocações: são representadas por linhas sólidas com setas. Já as invocações polimórficas são representados por linhas tracejadas. Os dois tipos de invocações são ilustrados na Figura4. Namespace: namespace é um conteı̂ner para tipos organizados em diretórios. Um namespace é representado por um retângulo com bordas arredondadas e linhas pontilhadas. Em Java, namespaces correspondem aos packages. Figure 4. Invocações 48 VEM Usando esta notação, o Polymorphic View é elaborado a partir da análise estática do código. Como pode ser observado pela Figura 5, a interface Drawable é explicitamente representada como um tipo abstrato (borda tracejada) e as invocações polimórficas (chamadas pelo método draw) são representadas por linhas tracejadas para cada implementação de Drawable (tipos Rectangle, Circle e Line). Através dessa visulização, é possı́vel observar que a invocação do método draw pela classe Plotter é representada por uma linha sólida, uma vez que é, de fato, uma invocação do método implementado nos tipos concretos Rectangle, Circle e Line. Neste sentido, o Polymorphic View permite com apenas um diagrama observar o relacionamento entre tipos polimórficos e seus clientes (Plotter, por exemplo), bem como o relacionamento entre os tipos polimórficos e outras classes que implementam seus métodos. Nossa abordagem permite também a análise do uso de polimorfismo a partir de uma perspectiva arquitetural, destacando relacionamentos que estão tipicamente escondidos. Para gerar o Polimorphic View, usamos uma ferramenta chamada Software Pathfinder, desenvolvida pelo nosso grupo de pesquisa. Na próxima seção, é demonstrado o uso do Polymorphic View em dois projetos Java. Figure 5. Polymorfic View para a Fig. 1 3. Entendendo o Polimorfismo Nesta seção, apresentamos como o Polymorphic View pode auxiliar na compreensão do uso de polimorfismo. Para este propósito, foram analisados dois projetos de código aberto: JUnit e FindBugs. A análise foi desenvolvida através dos seguintes passos: 1. Extrair os dados dos projetos, através da análise estática feita pelo Software Pathfinder; 2. Pesquisar todas as classes abstratas e interfaces; 3. Filtrar os tipos usando seguintes as regras: • Profundidade da hierarquia (P H) >= 1; • Número de filhos (N DF ) >= 1; • Número de métodos abstratos (N M A) >= 1; • ter pelo menos um cliente; 4. Construir o Polymorfic View para cada tipo filtrado; 5. Analisar o uso do polimorfismo através da visualização; 6. Complementar a análise com o código fonte. 49 VEM Nas próximas seções iremos apresentar alguns exemplos do uso de polimorfismo encontrados nos projetos JUnit e FindBugs. Como critério para selecionar os exemplos, focamos essencialmente em padrões de projeto GOF [Gamma et al. 1995]. 3.1. JUnit JUnit1 é um framework escrito em Java, seguindo a arquitetura xUnit para frameworks de teste unitário. Após construı́rmos os Polymorphic Views para o código do JUnit, encontrou-se um caso do padrão Composite, apenas observando a invocação polimórfica de TestSuite para Test, realizada pelo método run(), ilustrado na Figura 6. Test é uma interface implementada por DoubleTestCase, RepeatedTest, JUnit4TestCaseFacade e JUnit4TestAdapter, mas especialmente por TestSuite, caracterizando uma composição. Finalmente, analisando o código, foi confirmado a presença do padrão Composite. Um outro bom exemplo de uso do polimorfismo pode ser observado na Figura 8, no qual um tipo abstrato (BaseTestRunner) é usado para evitar uma dependência cı́clica. O tipo ResultPrinter usa TestListener, que é uma classe abstrata e TestRunner estende BaseTestRunner, retornando valores para ResultPrinter. 3.2. FindBugs O FindBugs2 é um programa que usa análise estática para encontrar problemas conhecidos como bug patterns: instâncias de código que provavelmente são erros em projetos Java. Figure 6. Polymorphic View para interface Test Analisando o Polymorphic Views para este projeto, foi encontrado um exemplo de injeção de dependência que pode ser observado na Figura 7. A classe SourceFile define uma estrutura de cache para arquivos que podem ser manipulados. Para isto, é usado invocações polimórficas para ZipSourceFileDataSource e FileSourceDataSource através da interface SourceFileDataSource. 3.3. Discussão A análise desses dois projetos de código aberto mostrou que o Polymorphic View auxilia na localização de estruturas polimórficas, que geralmente são escondidas em outras visualizações. Usando esta abordagem, inferências complexas sobre os projetos podem ser feitas, ajudando a entender e encontrar padrões, que provavelmente exigiriam uma busca exaustiva no código. O Polymorphic View fornece uma perspectiva estrutural (estática - namespaces e tipos) e comportamental (dinâmica - invocações) em um único diagrama, com a exibição das invocações polimórficas. 1 2 Mais informações em http://www.junit.org Mais informações em http://findbugs.sourceforge.net 50 VEM Ao destacar os tipos polimórficos e suas chamadas em uma única representação, o Polymorphic View ajuda na compreensão de padrões arquiteturais. Para que o mesmo estudo fosse feito somente utilizando diagramas da UML, seria necessário, pelo menos, usar um diagrama de classe e vários diagramas de sequência, um para cada caso de polimorfismo, conforme discutido na seção 2. 4. Trabalhos Relacionados Este trabalho encontra-se dentro do campo da análise de polimorfismo e reconstrução da arquitetura. Está relacionado também com os estudos empı́ricos que investigam a capacidade de uma visualização em apoiar a análise arquitetural polimórfica. Vários autores realizaram trabalhos sobre sobe polimorfismo e esta seção apresenta algumas das suas principais contribuições. Benlarbi e Melo [Benlarbi and Melo 1999] investigaram o impacto do polimorfismo sobre a qualidade do design OO, propondo um conjunto de métricas para projetos. Inicialmente, eles concluı́ram que o polimorfismo pode aumentar a probabilidade de falhas em software OO e indicaram que ele deve ser usado com precaução pelos projetistas e desenvolvedores. Eles sugeriram que o polimorfismo tende a ocorrer mais em projetos com elevado número de métodos e árvores de herança profundas. Denier e Gueheneuc Figure 7. Polymorphic View para a classe SourceFile e relacionamen[Denier and Gueheneuc 2008] protos puseram um modelo de herança para ajudar a compreensão da hierarquia de classes com foco em métodos das classes. Eles também definiram métricas e regras para destacar classes e comportamentos interessantes no que diz respeito à herança. Além disso, o modelo fornece como herança é utilizada em um programa. Denier e Sahraoui [Denier and Sahraoui 2009] propuseram uma visão única e compacta de todas as hierarquias de classe usando um layout personalizado, chamado Sunburst. Nos últimos anos, os estudos mais importantes sobre a herança e análise polimórficas foram desenvolvidos por Mihancea e Marinescu. Mihancea [Mihancea 2006] introduziu uma abordagem baseada em métricas relacionadas ao grau em que uma classe base foi destinada para reutilização da interface. Através da análise de como os clientes usam a interface da classe base, essas métricas quantificam o grau em que os clientes tratam uniformemente as instâncias dos descendentes da classe base, ao invocar métodos que pertencem a esta interface comum. Em trabalhos subsequentes [Mihancea 2008] [Mihancea 2009], Mihancea introduziu uma abordagem visual baseada em métricas para capturar a medida em que os clientes de uma hierarquia polimórfica manipulam essa hierarquia. Um vocabulário de padrão visual também foi apresentado de modo a facilitar a comunicação entre analistas. 51 VEM Todas as abordagens acima descritas, embora valiosas, não são adequadas quando o interesse é fornecer uma visão detalhada de polimorfismo. Este trabalho complementa os estudos com foco em uma visualização que destaca tipos abstratos e seus clientes, permitindo assim que o usuário possa capturar a maneira pela qual os clientes de uma hierarquia de classes fazem uso de polimorfismo. 5. Conclusões e Trabalhos Futuros Neste trabalho, foi a apresentado uma abordagem de explicitar o uso do polimorfismo, utilizando uma visualização baseada em grafo de chamadas estáticas, denominada Polymorphic View. Polymorphic View é composta por tipos, invocações e namespaces, permitindo o entendimento dos relacionamentos tipicamente escondidos em outras visualizações. Destina-se a ajudar na análise do uso de polimorfismo sobre uma perspectiva arquitetônica. Apesar das vantagens promissoras, algumas limitações surgiram durante a sua utilização nas análises apresentadas na seção 3. Em primeiro lugar, existe uma dificuldade em analisar todos os nı́veis da hierarquia de tipos, escondidas na representação de tipos. Além disso, em alguns casos, a fim de confirmar as hipóteses sobre os padrões de projeto, foi necessário analisar o código fonte. Os resultados obtidos até o momento abrem perspectivas para novas investigações sobre o polimorfismo. Em particular, temos algumas questões em aberto para serem respondidas: a) como os tipos polimórficos se relacionam com seus Figure 8. Polymorphic View para clientes? b) quais padrões de projeto que classe abstrata ResultPrinter adotam polimorfismo são encontrados? c) quais anti-padrões são encontrados? d) há diferenças entre o uso de polimorfismo em Java e em outras linguagens? e) uso do polimorfismo é uma opção deste as primeiras versões de um tipo ou é o resultado de um processo de evolução do software, através de refatorações, por exemplo? Como parte de trabalhos futuros, pretendemos desenvolver uma visualização interativa, além de acrescentar detalhes como a hierarquia de herança e estruturas internas dos tipos (métodos e atributos). Em outra direção, iremos avaliar o uso do Polymorphic View através de experimentos controlados. Finalmente, iremos investigar porque os arquitetos de software usam polimorfismo em seus projetos, pesquisando as intenções por trás da adoção de estruturas polimórficas. References Ambler, A. (1995). Invocation polymorphism. In Proceedings of Symposium on Visual Languages, pages 83–90. IEEE Comput. Soc. Press. 52 VEM Benlarbi, S. and Melo, W. L. (1999). Polymorphism measures for early risk prediction. In Proceedings of the 21st international conference on Software engineering - ICSE ’99, pages 334–344, New York, New York, USA. ACM Press. Booch, G., Maksimchuk, R. A., Engle, M. W., Young, B. J., Conallen, J., and Houston, K. A. (2007). Object Oriented Analysis & Design with Application. Pearson Education, Boston, MA, 3rd ed edition. Caserta, P. and Zendra, O. (2010). Visualization of the Static Aspects of Software: A Survey. IEEE transactions on visualization and computer graphics, 17(7):913–933. Denier, S. and Gueheneuc, Y.-G. (2008). Mendel: A Model, Metrics, and Rules to Understand Class Hierarchies. In 2008 16th IEEE International Conference on Program Comprehension, number 2, pages 143–152. IEEE. Denier, S. and Sahraoui, H. (2009). Understanding the use of inheritance with visual patterns. In 2009 3rd International Symposium on Empirical Software Engineering and Measurement, pages 79–88. IEEE. Dutoit, A. H. and Bruegge, B. (2010). Object-Oriented Software Engineering Using UML, Patterns, and Java. Prentice Hall. Gamma, E., Helm, R., Johnson, R., and Vlissides, J. (1995). Design Patterns: Elements of Reusable Object-Oriented Software. Addison-Wesley, New York, New York, USA. Grove, D., DeFouw, G., Dean, J., and Chambers, C. (1997). Call graph construction in object-oriented languages. Proceedings of the 12th ACM SIGPLAN conference on Object-oriented programming, systems, languages, and applications - OOPSLA ’97, pages 108–124. Hoogendorp, H. (2010). Extraction and Visual Exploration of Call Graphs for Large Softeware Systems. PhD thesis, Groningen University. Lange, D. and Nakamura, Y. (1997). Object-oriented program tracing and visualization. Computer, 30(5):63–70. Larman, C. (2004). Applying UML and Patterns: An Introduction to Object-Oriented Analysis and Design and Iterative Development, 3/e. Prentice Hall, Upper Saddle River, NJ, USA, 3 edition edition. Mihancea, P. (2006). Towards a Client Driven Characterization of Class Hierarchies. In 14th IEEE International Conference on Program Comprehension (ICPC’06), pages 285–294. IEEE. Mihancea, P. F. (2008). Type Highlighting: A Client-Driven Visual Approach for Class Hierarchies Reengineering. 2008 Eighth IEEE International Working Conference on Source Code Analysis and Manipulation, pages 207–216. Mihancea, P.-f. (2009). A Novel Client-Driven Perspective on Class Hierarchy Understanding and Quality Assessment. PhD thesis, University of Timisoara. Ponder, C. and Bush, B. (1994). Polymorphism considered harmful. ACM SIGSOFT Software Engineering Notes, 19(2):35–37. 53 VEM On the Use of Context Information for Supporting Software Visualizations Renan Vasconcelos, Marcelo Schots, Cláudia Werner Programa de Engenharia de Sistemas e Computação (PESC) – COPPE/UFRJ Caixa Postal 68.511 – 21945-970 – Rio de Janeiro, RJ – Brasil {renanrv,schots,werner}@cos.ufrj.br Abstract. Software visualization helps to identify issues and speed up the indications of solution. The efficiency of visualization interpretation varies according to the elements that compose the representations. The choice of such elements must comply with the context that comprises their use, possibly requiring or promoting visualization changes. This work analyzes some information that is part of this context, highlighting the importance and influence of each one in a visualization. Examples of use of this context information are presented in order to illustrate the influence on the choice of visualization techniques in different scenarios. 1. Introduction Interpreting the vast amount of information available becomes complicated in environments with varied types of information and tasks. Visualization may represent a suitable alternative in this type of situation, since abstractions of data can reveal patterns, clusters, gaps, or outliers [Shneiderman 1996]. However, some aspects that are closely related to how the graphical representation is displayed must be taken into account, such as the task at hand, the interactions performed by users, and the characteristics of data. The purpose of using a given visualization is usually related to some task that will be fulfilled or aided by it. Indeed, tasks relate to visualizations’ design and evaluation [Schulz et al. 2013]. The former combines data and tasks in order to seek the most appropriate representation. Visualization evaluation, in turn, combines data and visualization in order to investigate how appropriate is the visual result in supporting a task. Thus, tasks can be considered as input for visualizations, representing external context information concerning the visualization and the data, seeking to make a graphical representation meaningful. Because of the intrinsic relation with the visualization field, interaction can also be considered one of visualization’s main components. Although separated from the graphical result, these components are strongly related, since interactions may lead to changes in representations [Yi et al. 2007]. The process of information visualization is based on the data transformed into images that are more easily interpretable by humans [Spence 2000]. Thus, it is possible to note the importance of data for such domain. The data to be represented by a visualization should be a vital aspect to be considered. Accordingly, the viewed data can also be analyzed as contextual information. 54 VEM This article aims at exploring the use of context information in order to support information visualization, indicating its use for software visualization as well. Particularly, three types of information are discussed: data, interaction and task. In order to illustrate these key elements on the visualization context, some motivating examples are also presented. The remaining of the paper is organized as follows: Section 2 introduces the concept of context awareness; the elements that may influence the visualization context are discussed in Section 3; Section 4 presents a practical example of use of context information in visualizations; related works are listed in Section 5; and the final remarks are presented in Section 6. 2. Context-Aware Applications Context-aware applications are characterized by capturing information from the environment, including users and their behavior, in order to provide customized answers according to each context state [Chen & Kotz 2000]. In order to derive actions from the current state, this context must be well-defined. In this sense, context models help to standardize the representation of information. A context model should support different levels of elements, such as: (i) entities, related to the context dimensions; (ii) context information, showing how each item collaborates to the description of a particular entity; (iii) context situations, which are composed by entities and their information with defined values; and (iv) rules, which allow associating actions to be performed on the occurrence of a given situation. A notation that follows this structure is UbiFEX [Fernandes et al. 2011]. With a defined notation, it is necessary to evaluate the aspects that should be included in the model, i.e., to examine the appropriateness and relevance of the information to compose the desired context model. In the context of this work, some information that is relevant for visualizations is discussed. This relevance is interpreted in terms of how modifications in the contextual information can lead to or require changes in visualizations. 3. The Role of Context Information in Visualizations The most important aspect of using visualizations is that some meaning must be transmitted, regardless of the medium where they are displayed or the chosen data source. The featured representations should enable users to interpret the results and to obtain useful information. In this sense, besides the values of the selected data, techniques aimed at expressing the visualization context are also required to provide an interpretive meaning through data representation. It is important to relate data values with the phenomenon that they represent [Keller & Keller 1993]. With such characteristic, visualizations can make their users aware of different situations. Some aspects can be considered as contextual information in order to define the state of a view, given their relevance. In other words, changes in these information values may result in adaptations in the view. These aspects are discussed as follows. 3.1. Interactions Interactions allow a direct communication between users and systems [Dix et al. 2004]. When a system is represented through visualizations, interactions have an explicit 55 VEM relationship with the change on a view, since interaction techniques may enable different actions on this view. The variety of existing interaction elements is demonstrated in [Vasconcelos et al. 2014], where each interaction technique is identified as an information visualization domain feature. In order to identify what changes might occur in a view based on the applied interactions, it is necessary to check the user intentions on performing an action in a view. In this sense, Yi et al. (2007) present seven categories of interaction that indicate possible changes in visualizations, namely: Select, Explore, Reconfigure, Encode, Abstract/Elaborate, Filter and Connect. It is worth noting that the context extraction involves registering past user interactions. The user interaction on a view denotes his/her behavior on the representation of a data set. This behavior can be considered a useful aspect for context analysis, since it allows performing changes in the visualization representation. Interactions may reveal user preferences that can be useful to a recommended visualization change. For instance, a view is set to represent the most searched keywords in a software repository. Each element displayed in a view has its representation based on the number of each keyword’s occurrences, so that the size of an element is proportional to the number of searches for that keyword. If only keywords with a number of occurrences above a certain threshold are selected, meaning that the user only selects the larger elements, the view can be updated to display just those keywords’ elements. In this case, removing such non-interesting records would be more suitable. Appropriate context information for this case is summed up as the minimum occurrence of selected items. 3.2. Data The importance of data in visualizations is recognized by the number of information visualization taxonomies that depend on the data type [Müller & Schumann 2003] [Chi & Riedl 1998]. Thus, it is necessary to assess how changes in the data may impact in visualizations. With this goal, it is important to check the data types and the transformations that occur in existing visualizations in the literature. The study of Chi (2000) uses the Data State Model [Chi & Riedl 1998] to evaluate views with different techniques. This evaluation includes (i) a survey of data values, (ii) data transformations for composing an analytical abstraction), (iii) visualization transformations, turning an analytical abstraction into a visual abstraction, and (iv) visual mapping transformations, generating a graphical representation. A survey of various visualizations allows observing similarities between techniques and assessing the necessary steps for representing the data. In this sense, it is worth noting that changes in data values should promote a number of specific transformations for each visualization technique until the graphical result. It is worth emphasizing that often the change in the data set cannot be predicted. In this sense, event-based visualizations [Müller & Schumann 2003] must have special precaution mechanisms, treating possible restrictions on the application of certain visualization techniques, such as interpolation values. 56 VEM Since changes in the data set usually influence the graphical result, an example can be seen in the selection of a very large data group. When one needs to represent many visual elements (e.g., in the case of the searched keywords on a software repository), behaviors that can be adopted in a view are: (i) the adjustment of scale, providing more space for a larger number of simultaneous records, and (ii) filtering mechanisms, in order to show only the (most) relevant items [Shneiderman 1996]. It is also important to check the data type in order to evaluate how the information can be displayed in a view. Examples of appropriate context information to address these constraints are the number of records and the data type. For instance, when a certain number of records can impact negatively on the representation understanding, one can apply appropriate visualization features for updating the scale and filtering, such as geometric zooming and removal. This will help to avoid the overload of elements to be displayed on a small screen. 3.3. Tasks In addition to the user interactions and data, the view focus can be assigned by the task to be supported by the visualization. In this case, the so-called visualization tasks allow for analyses in order to obtain a set of recurring tasks whose accumulated knowledge would optimize the visualization design and evaluation [Schulz et al. 2013]. An appropriate visualization for a task must consider elements that characterize such task. Schulz et al. (2013) identify dimensions that describe a task relating to its context, aiming to extract information about the user, such as the moment when a task is performed, the ordering in a sequence of tasks, and who will carry it out. Aiming at defining a set of views that would be important for a domain, it is necessary to define which tasks cover the main issues that should be represented. For example, an important task in the software development domain concerns the possibility of reusing existing reusable assets (development with reuse), and some information can be visually represented for providing awareness on this possibility [Schots 2014], such as the number of reusable assets available in the organization for the current project domain. The number of finished projects in the domain of a current project also indicates if such domain has a significant number of projects, showing if there should be more reusable assets available. The number of searches in the reuse repository by the same keyword without results helps verifying if a particular feature is commonly expected/requested (and possibly present in several projects) in the organization. This would indicate interest in the existence of a reusable asset that meets this demand. A group of related context information can be comprised by the number of available assets to the current domain, the number of legacy projects in the current domain and the number of keywords searches in the repository without results. 3.4. Context Rules From the aspects considered relevant for the context, which shall be treated as context information, it is necessary to directly relate the use of certain visualization techniques to the momentary state of the context. Context rules are responsible for this association. 57 VEM With a defined context situation, through a set of information with certain assigned values, it is possible to define the configuration of a view. The occurrence of a specific context implies the domain feature selection [Fernandes et al. 2011] – in this case, the selection of visualization elements. Figure 1 displays the composition logic of a context rule using the UbiFEX notation [Fernandes et al. 2011]. <RULE> ::= <CONTEXT-SITUATION> implies <FEATURES> Figure 1. Context rule model The information visualization domain features and the constraints between them (defined by composition rules) are described in [Vasconcelos et al. 2014]. These rules take into account a set of identified recommendations for the application of visualization techniques listed in [Vasconcelos et al. 2013], among others. 4. Example of Use Aiming at recognizing how context information can influence visualizations in practice, we present a unified example comprising the aforementioned aspects. A context rule is proposed to illustrate the use of context for the selection of visualization elements. 4.1. Context Situation In order to map a context to the selection of visualization features, it is necessary to define context situations, which may provide a wider reach for the visualizations. Because such visualizations are intended to be context-aware, the occurrence of a situation should bring, through changes in a view, the necessary attention to a task. With the occurrence of some values for the context information, the task of identifying the necessity of reusable assets may rise as the focus for the final view. A related context situation for this purpose is presented in Figure 2. It is noteworthy that the thresholds of each kind of information should be customizable by the organizations. Develop a new reusable asset Number of records > 30 Data type = String Number of available assets to the current domain < 10 Number of legacy projects in the current domain > 5 Number of keywords searches in the repository without results > 7 Figure 2. Context situation Another context situation can encompass changes that can be promoted through interactions in a view. Since the user behavior upon such view should be recognized as context information, an appropriate context situation holds the same information of the previous situation and incorporates the interaction information, as shown in Figure 3. Filter reusable asset development candidates Minimum occurrence of selected items > 20 Number of records > 30 Data type = String Number of available assets to the current domain < 10 Number of legacy projects in the current domain > 5 Number of keywords searches in the repository without results > 7 Figure 3. Context situation with an interaction behavior 58 VEM 4.2. Context-Aware Visualization After the appropriate context situations have been defined, the context rules will map the features that a visualization should have in order to better support the user carrying out the task of identifying the necessity of new reusable assets. A visualization that matches the task goal can organize the keywords (searched in the repository without results) in a bubble structure (pack layout), representing each item as an overview. With a large data set (e.g., comprising more than 30 items), a geometric zooming mechanism can be helpful to adjust the scale. Colors can be used to highlight different domains, and sizes can represent the number/frequency of searches. Finally, the items’ names and metadata can be shown as tooltips within each bubble, after a simple selection. A context rule that corresponds to these observations is illustrated in Figure 4. A visualization that matches this rule is shown in Figure 5. Context Rule 1 (CR_1) Develop a new reusable asset implies (Pack Layout AND Geometric Zooming AND Highlighting AND Tooltip AND Overview AND Selection) Figure 4. Context rule for the necessity of reusable asset Figure 5. Visualization of search terms without corresponding assets Another rule can be proposed to comprise the interaction aspect, in order to remove items with less than 20 occurrences based on the user selection. Such context rule is presented in Figure 6. Context Rule 2 (CR_2) Filter reusable asset development candidates implies (Pack Layout AND Geometric Zooming AND Highlighting AND Tooltip AND Overview AND Selection AND Removal) Figure 6. Context rule for updating view for the necessity of new reusable asset 5. Related Work Some existing approaches in the literature also discuss the role of data, interactions and tasks in selecting the most appropriate visualizations. Beck et al. (2013) propose a methodology for choosing a graph-based visualization according to application profiles. 59 VEM The application characterization is accomplished through a classification of data and the tasks involved for their representation. This study supports experts during the selection of visualization techniques for a given application. In a task-focused approach related to visualizations, Schulz et al. (2013) present a visualization tasks design space, with shared taxonomy and models. This study allows the evaluation of the suitability of a task to a specific case, and its selection to compose views for end users. The design space assists in the orientation and differentiation between tasks, having as output the recommendation of views to meet a selected task. Also seeking to organize a taxonomy, Chi (2000) examines characteristics of visualization techniques at different levels. By checking the similarities and differences between techniques in various data domains, it was possible to check requirements of interest for a proper application of each technique. From the presented studies, it is worth noting the focus on elements related to tasks and data for the use of visualization techniques. Although the work of Beck et al. (2013) considers data and tasks, it gears its analysis to graph-based visualization layouts. The other works focus on proposing taxonomies for common visualization applications, considering aspects of data [Chi 2000] and tasks [Schulz et al. 2013]. The current study aims at analyzing the context in a broader way, considering data, interactions and tasks. 6. Final Remarks The proper use of visualizations, with a careful choice of techniques, can contribute to a more efficient interpretation of results. Such proper use can accelerate the decision making and allow carrying out different activities with a higher level of awareness. In scenarios with a complex information flow, such as software development, visualizations that meet the needs of different tasks can ease the information processing. In this sense, an analysis of the most relevant aspects of a context can provide indications about what should be graphically represented. Also, in order to treat the whole data as a context, the data values should be periodically checked, so that a visualization can be adapted/updated or completely changed. The context information analyzed in this study integrates to the APPRAiSER approach [Schots 2014] through CAVE, a tool under development that seeks to provide context-aware visualizations for the software reuse scenario. Data, interactions and reuse tasks will serve as input in order to recognize the context and select the appropriate visualization elements for the current state. An experiment will be carried out for evaluating the pros and cons that context-driven visualization may provide. References Beck, F., Burch, M., & Diehl, S. (2013). Matching application requirements with dynamic graph visualization profiles. In 17th International Conference on Information Visualisation, London, UK, pp. 11-18. Chen, G., Kotz, D. (2000). A Survey of Context-Aware Mobile Computing Research. Dartmouth College Technical Report TR2000-381. 60 VEM Chi, E. H. H., & Riedl, J. T. (1998). An operator interaction framework for visualization systems. In IEEE Symposium on Information Visualization, Durham, USA, pp. 6370. Chi, E. H. (2000). A taxonomy of visualization techniques using the data state reference model. In IEEE Symposium on Information Visualization (InfoVis), Salt Lake City, USA, pp. 69-75. Dix, A., Finlay, J., Abowd, G. D. and Beale, R. (2004). Human-computer interaction, 3rd ed: Pearson Prentice Hall. Fernandes, P., Teixeira, E. N., Werner, C. (2011). An Approach for Feature Modeling of Context-Aware Software Product Line. J. Univers. Comput. Sci., v. 17, n. 5, pp. 807829. Keller, P. R., & Keller, M. M. (1993). Visual cues: practical data visualization (p. 6). Los Alamitos, CA: IEEE Computer Society Press. Müller, W., & Schumann, H. (2003). Visualization methods for time-dependent data-an overview. In Proceedings of the 35th Winter Simulation Conference, New Orleans, USA, Vol. 1, pp. 737-745. Schots, M. (2014). On the Use of Visualization for Supporting Software Reuse. Ph.D. Qualifying Exame, Federal University of Rio de Janeiro, Brazil. Schulz, H. J., Nocke, T., Heitzler, M., & Schumann, H. (2013). A design space of visualization tasks. In IEEE Trans. Visual. Comput. Graphics, 19(12), 2366-2375. Shneiderman, B. (1996). The Eyes Have It: A Task by Data Type Taxonomy for Information Visualizations. In IEEE Conference on Visual Languages, Columbus, USA, pp. 336-343. Spence, B. (2000). Information Visualization. Pearson Education Higher Education Publishers. Vasconcelos, R. R., Schots, M., & Werner, C. (2013). Recommendations for ContextAware Visualizations in Software Development. In 10th Workshop on Modern Software Maintenance, Salvador, Brazil, pp. 41-48. Vasconcelos, R., Schots, M., & Werner, C. (2014). An information visualization feature model for supporting the selection of software visualizations. In 22nd International Conference on Program Comprehension, Early Research Achievements track, Hyderabad, India, pp. 122-125. Yi, J. S., ah Kang, Y., Stasko, J. T., & Jacko, J. A. (2007). Toward a deeper understanding of the role of interaction in information visualization. In IEEE Trans. Visual. Comput. Graphics, 13(6), 1224-1231. 61 VEM ArchGraph: Modularização Automática de Sistemas Usando Clusterização de Grafos de Dependência Guilherme A. Avelino1 , Marco Tulio Valente1 1 Departamento de Ciência da Computação, UFMG, Brasil {gaa,mtov}@dcc.ufmg.br Abstract. A proper modularization is very important to aid in the maintenance and evolution of a system. In order to help to modularize an existing software, this paper presents a strategy for automatic modularization based on data extracted from source code. In our approach, dependencies between software entities are modeled using graphs and, by relying on clustering algorithms, we construct logical groupings of such entities. Resumo. Uma adequada modularização é de grande importância para auxilio na manutenção e evolução de um sistema. Buscando auxiliar a atividade de modularizar um sistema já existente, esse artigo apresenta uma estratégia para geração automática da modularização baseada em dados extraı́dos de seu código fonte. Em nossa abordagem, dependências entre entidades de um software são modeladas utilizando grafos e, aplicando algoritmos de clusterização, construı́mos agrupamentos lógicos de tais entidades. 1. Introdução Uma boa modularização é essencial para o adequado desenvolvimento e evolução de um software. Um bom projeto modular facilita o gerenciamento do software, permitindo a divisão de atividades, além de limitar o escopo de alterações e melhorar o entendimento do sistema [Parnas 1972]. Entretanto, existem diversos sistemas que não foram desenvolvidos de forma modular, ou ainda sua modularização pode ter sofrido uma degradação durante sua evolução [Lehman et al. 1997]. Para tornar a manutenção de tais sistemas novamente gerenciável é preciso remodularizá-los, agrupando as entidades de software baseados em suas semelhanças e dependências. Nesse trabalho, apresentamos uma técnica e uma ferramenta de apoio, denominada ArchGraph, que extrai as dependências entre classes a partir do código fonte de um sistema Java e representa tais dependências utilizando grafos. Com base no grafo gerado, são usados dois diferentes algoritmos de clusterização, objetivando identificar possı́veis agrupamentos lógicos desses artefatos baseados em suas dependências. Os algoritmos utilizados, representam duas diferentes estratégias de clusterização: algoritmos de otimização e algoritmos baseados na teoria dos grafos [Wiggerts 1997], permitindo assim avaliar duas diferentes estratégias, as quais são comparadas no final. O restante deste artigo está organizado da seguinte forma. A Seção 2 apresenta a solução proposta no artigo, explicando como essa foi construı́da e detalhando os algoritmos utilizados. A Seção 3 apresenta um estudo de caso desenvolvido com objetivo de avaliar a qualidade da modularização gerada. Trabalhos relacionados são apresentados na Seção 4. Por fim, a Seção 5 conclui este trabalho e levanta alguns trabalhos futuros. 62 VEM 2. Solução Proposta O ArchGraph foi desenvolvido como um plug-in para o ambiente de desenvolvimento Eclipse. Essa abordagem, além de facilitar a utilização da ferramenta ao integrá-la em um ambiente de desenvolvimento largamente utilizado, ajuda na extração das informações de dependências entre entidades de projetos em desenvolvimento. As subseções seguintes apresentam detalhes de como a solução foi construı́da. 2.1. Arquitetura Conforme mostra a Figura 1, o plug-in ArchGraph é formado por três componentes principais: Extrator de Dependências, Motor de Clusterização e Gerador da Visualização, cada um responsável por uma etapa do processo de geração dos módulos. Figura 1. Arquitetura proposta Na primeira etapa, o Extrator de Dependências faz o parsing de uma árvore sintática abstrata extraı́da de um projeto Java e constrói seu grafo de dependências. Nesse grafo, cada classe é representada através de um nó e a dependência entre classes é sinalizada através de uma aresta. Na segunda etapa, o grafo é repassado ao Motor de Clusterização, o qual aplica um dos algoritmos detalhados na Seção 2.2, gerando um conjunto de conjuntos de classes, que representam a nova modularização proposta por nossa solução. A última etapa, realizada pelo Gerador da Visualização, consiste na apresentação gráfica da modularização proposta. Para auxiliar não só o entendimento, como também na avaliação da modularização produzida, são geradas duas representações diferentes: uma utilizando grafos, onde os agrupamentos são sinalizados através de cores e outra utilizando um Mapa de Distribuição [Ducasse et al. 2006], que apresenta os módulos gerados mapeados nos pacotes reais do sistema. A Seção 3 fornece mais detalhes de como os resultados são apresentados. 2.2. Algoritmos de Clusterização Após a geração do grafo de dependências das classes do sistema alvo, é preciso identificar quais classes estão relacionados e assim inferir como essas podem ser agrupadas. Para realizar tais atividades, o ArchGraph implementa os dois algoritmos detalhados a seguir. 63 VEM 2.2.1. Hill Climbing Para avaliar a qualidade da modularização de um sistema dois critérios largamente utilizados são coesão e acoplamento [Anquetil et al. 1999]. Coesão avalia o grau de similaridade entre classes agrupadas (intra-cluster) e acoplamento define a similaridade entre classes de diferentes agrupamentos (inter-clusters). Utilizando tais caracterı́sticas como critério de qualidade, uma boa modularização deve maximizar a coesão e diminuir o acoplamento. Adotando tais critérios, podemos definir uma função, que dado um grafo e um conjunto de agrupamentos de classes, retorne um valor baseado no numero de arestas intra-cluster e inter-clusters, sendo retornado valores maiores para agrupamentos com mais arestas intra-cluster do que inter-clusters. Com tal função, nosso problema de modularizar um software poderia ser resolvido com uma busca pelo agrupamento ideal, ou seja aquele com maior valor para tal função. O problema dessa abordagem é que mesmo para sistemas pequenos a quantidade de agrupamentos possı́veis é muito grande. Como exemplo, para um sistema com 15 classes, terı́amos 1.382.958.545 agrupamentos possı́veis. Como a maioria dos sistemas possui bem mais classes, normalmente centenas ou milhares delas, tal abordagem é inviável computacionalmente. Quando a solução ótima não é viável devemos buscar soluções aproximadas, que embora não garantam o resultado ótimo, retornam resultados suficientemente adequados. O algoritmo Hill Climbing [Russell and Norvig 2009] se encaixa nesse cenário. Ele inicia com uma solução arbitrária do problema e tenta achar um resultado melhor, incrementalmente, mudando um único elemento da solução obtida até aquele momento. Se a mudança produzir um melhor resultado, uma nova mudança é feita nessa nova solução, sendo esse passo repetido até que não seja possı́vel encontrar mais melhorias no resultado. Nossa implementação para o algoritmo Hill Climbing se baseia no trabalho de Mancoridis e Mitchell [Mancoridis et al. 1998], o qual utiliza a função de qualidade da modularização (MQ) apresentada abaixo. A fórmula define a qualidade em termos da soma do grau de dependências entre classes do mesmo cluster (Ai ) e de dependências entre classes de clusters diferentes (Eij ), sendo k o número total de clusters. ( 1 Pk MQ = k i=1 Ai − 1 k(k−1) 2 A1 Pk i,j=1 Ei,j , se k > 1 (1) , se k=1 2.2.2. Betweenness O segundo algoritmo tem como base o trabalho de Girvan e Newman [Girvan and Newman 2002], que propõe uma variação do algoritmo tradicional de Betwenness, realizando o cálculo da centralidade das arestas ao invés da centralidade dos vértices. A centralidade das arestas de um grafo é calculada tendo como base o número de caminhos mais curtos entre todos vértices do grafo. Se o grafo possui conjuntos de vértices fortemente conectados e esses são fracamente conectados a outro grupos, por meio de uma ou poucas arestas, então todos os caminhos mais curtos entre grupos passarão por essas poucas arestas, fazendo com que elas possuam alto valor de centralidade. Assim, o algoritmo calcula a centralidade das arestas e, ao remover as de 64 VEM maior valor, expõe as comunidades existentes no grafo. Em nossa solução utilizamos uma implementação do algoritmo Betwenness disponibilizada pela biblioteca de modelagem de grafos JUNG1 . Esse algoritmo requer que seja informado o número de arestas a serem removidas. 3. Estudo de Caso Para avaliar a qualidade da modularização gerada, foram realizados experimentos com dois diferentes sistemas de código aberto: ArtOfIllusion2 e JHotDraw3 . Os experimentos realizados têm como objetivo dar respostas aos seguintes questionamentos: • Q1: Qual dos algoritmos de clusterização implementado produz melhores resultados? Mais do que eleger um vencedor, esse questionamento busca identificar direcionamentos para futuras pesquisas e indı́cios de oportunidades de aprimoramento da solução. • Q2: A modularização gerada representa uma adequada divisão lógica do sistema? A resposta a esse questionamento é de fundamental importância para o uso prático da ferramenta. O fato de ser gerada uma modularização com ótimos valores de acoplamento e coesão pode não necessariamente representar o agrupamento adequado em termos da estrutura lógica do sistema. • Q3: A modularização gerada é capaz de apontar falhas e/ou oportunidades de melhoria da modularização do sistema? Com essa pergunta buscamos identificar se mesmo o sistema tendo sido desenvolvido de forma modular nossa solução gera informações que auxiliem a aprimorar essa modularização. 3.1. Análise dos Algoritmos de Clusterização (Q1) Os dois algoritmos foram aplicados a cada um dos sistemas selecionados. Os resultados apresentados focam em dependências do tipo herança, ou seja, as arestas ligam classes que possuem uma herança direta do tipo pai e filha. A Tabela 1 apresenta um resumo dos experimentos. O algoritmo Betweenness foi configurado para remover 10% das arestas existentes (32 para ArtOfIllusion e 48 para o JHotDraw). Foram realizadas 10 execuções do Hill Climbing, sendo os valores apresentados uma média dos resultados obtidos. Tabela 1. Resultados dos testes. *média, com desvio padrão inferior a 0,01 Hill Climbing* Betweenness o MQ N de Clusters MQ No de Clusters ArtOfIllusion 0,5280 49 0,2728 57 JHotDraw 0,5928 104 0,4236 120 Sistema Analisando os clusters gerados pelos dois algoritmos, mostrados na Figura 2, é possı́vel observar que o algoritmo de Hill Climbing tende a agrupar uma grande quantidade de classes em um único cluster e o restante das classes são divididas em pequenos 1 Java Universal Network/Graph. http://jung.sourceforge.net http://www.artofillusion.org 3 http://www.jhotdraw.org 2 65 VEM clusters. Essa forma de agrupamentos é descrita como uma divisão não adequada de um sistema em [Anquetil et al. 1999], sendo denominada black hole, pois um cluster atua como um buraco negro absorvendo praticamente todas as classes. Já a modularização sugerida pelo algoritmo Betweenness, mesmo sem uma análise individual dos clusters, é mais próxima de uma modularização esperada, onde temos diversos módulos de tamanhos similares e poucas classes não agrupadas. (a) ArtOfIllusion com Betweenness (b) ArtOfIllusion com Hill Climbing (c) JHotDraw com Betweenness (d) JHotDraw com Hill Climbing Figura 2. Resultado da clusterização com os dois diferentes algoritmos Tendo em vista que o algoritmo Betweenness apresentou sugestões de modularização mais próximas de uma divisão lógica do sistema, os questionamentos Q2 e Q3 serão analisados com foco nos resultados obtidos com esse algoritmo. 3.2. Análise da Qualidade da Modularização Gerada (Q2 e Q3) Para avaliar a qualidade da modularização utilizaremos a visualização do resultado como um Mapa de Distribuição. Um Mapa de Distribuição é uma visualização na qual os pacotes são mostrados como caixas, sendo essas preenchidas com quadrados coloridos que representam as classes do pacote. Em nossa visualização a cor/número do quadrado representa o módulo sugerido pela ferramenta para aquela dada classe. Dessa forma, utilizando o Mapa de Distribuição é possı́vel comparar a modularização sugerida pela ferramenta (cor das classes) com a modularização real (caixas representando os pacotes do sistema). Os Mapas de Distribuição, obtidos com o algoritmo Betweenness na configuração descrita anteriormente, são apresentado na Figura 3. Para evitar uma poluição excessiva da figura, removemos clusters com menos de três classes e apresentamos apenas os 20 pacotes com maior número de classes. Para análise da qualidade da modularização destacamos algumas observações: 66 VEM (a) ArtOfIllusion (b) JHotDraw Figura 3. Mapa de Distribuição para os dois sistemas analisados. Cada número/cor corresponde a um dos agrupamentos gerados pela ferramenta • A sugestão de modularização para o pacote artofillusion.image.filter foi exatamente implementada. Esse pacote contem todas as classes do cluster 18. O mesmo acontece com os pacotes org.jhotdraw.draw.connector e artofillusion.test. • Dentre as 45 classes do pacote artofillusion.procedural, 43 classes pertencem ao módulo 16, sugerido pelo ArchGraph, e as duas outras foram colocadas no módulo 6. Ao analisar as classes detalhadamente é possı́vel observar que todas as 43 classes do pacote estão relacionadas com a classe denominada Module e que o padrão de nome dessas 43 classes tem como subnome “Module”. A mesma análise leva a crer que as outras duas classes estariam melhor agrupadas no pacote artofillusion.ui, pois elas estão relacionadas a criação de interface gráfica e menus. • O pacote artofillusion.raytracer possui 12 classes, sendo que nesse caso foi sugerida a distribuição dessas classes em dois módulos diferentes, 13 e 14. Uma análise, utilizando apenas o padrão de nomenclatura das classes, valida a sugestão da ferramenta, pois as classes do módulo 13 possuem em sua nomenclatura o subnome “Light”(RTLight, RTSphericalLight e RTDirectionalLight), enquanto que as demais possuem outro padrão de nomenclatura. Análise semelhante pode ser estendida a pacotes como animation.distorcion e org.jhotdraw.app.action.edit. • O pacote artofillusion é um dos pacotes que apresentou maior variedade de módulos. Foi sugerido que muitas das classes desse pacote fossem agrupadas com classes de outros pacotes. Um fato a ser observado nesse caso é que o pacote artofillusion é a raiz do projeto. A raiz do projeto é normalmente o local onde as classes são criadas quando não se sabe ou se está em dúvida sobre qual pacote uma classe deve pertencer. Dessa forma, o fato de a ferramenta ter sugerido uma 67 VEM modularização bem diferente da implementada nesse pacote pode ser entendido como indı́cio de que não há uma adequada modularização de suas classes. As quatro observações destacadas contribuem para mostrar que a modularização gerada pela ferramenta faz sentido do ponto de vista lógico do sistema (Q2), pois representa em muitos casos a implementação observada na prática para os sistemas analisados. Além disso as três últimas observações sugerem que a ferramenta é capaz de gerar indı́cios de erros de modularização, bem como oportunidades para aprimoramento dessa (Q3). 4. Trabalhos Relacionados Dois trabalhos importantes na área são [Anquetil et al. 1999] e [Wiggerts 1997], pois realizam uma explanação ampla sobre o tema, sendo bastante úteis para conhecimento das principais técnicas de clusterização utilizadas para engenharia reversa de sistemas. A ferramenta BUNCH [Mancoridis et al. 1998, Mitchell and Mancoridis 2006] representa um dos principais trabalhos relacionadas a clusterização de sistemas baseado em informações extraı́das do código fonte. BUNCH realiza a clusterização com base na busca por agrupamentos de entidades que apresentem maior valor para uma função de qualidade da modularização, utilizando para isso um algoritmo baseado na técnica de Hill Climbing e heurı́sticas para geração do agrupamento inicial e dos agrupamentos vizinhos. Outros trabalhos que seguem abordagem semelhantes são [Praditwong et al. 2011] e [Annervaz et al. 2013]. Nosso trabalho difere desses trabalhos mencionados, pois não se restringe ao uso de algoritmos baseado em busca heurı́stica. Como abordagem alternativa, adaptamos um algoritmo de identificação de comunidades em grafo, baseado na centralidade de arestas, para o problema de modularização de sistemas. No melhor do nosso conhecimento, não existem trabalhos que empreguem tal abordagem. 5. Conclusões e Trabalhos Futuros Esse trabalho apresentou uma solução para modularização automática de sistemas baseada no uso de técnicas de clusterização. Os resultados obtidos mostram que embora a modularização proposta pela ferramenta não seja necessariamente a ideal é uma boa indicação do caminho a ser seguido, sendo útil como um modelo inicial, a ser refinado por um engenheiro de software. Foi possı́vel observar que mesmo com valores inferiores de MQ os resultados apresentados pelo algoritmo Betweenness são mais próximos de uma modularização adequada. Tais resultados indicam que essa é uma abordagem promissora, sendo uma alternativa ao tradicional uso do algoritmo Hill Climbing (usado, por exemplo, pela conhecida ferramenta Bunch). Em trabalhos futuros deseja-se realizar testes com outros algoritmos de clusterização, bem como a combinação de diferentes tipos de dependências entre classes. Pretende-se também investigar modificações na fórmula de cálculo da qualidade da modularização, pois acreditamos que é possı́vel aprimorá-la de forma que ela gere melhores resultados. Por fim, pretende-se investigar o uso dos clusters propostos para detectar violações arquiteturais [Passos et al. 2010, Terra and Valente 2009] e também para comparar e analisar remodularizações de sistemas [Santos et al. 2014, Silva et al. 2014]. 68 VEM Agradecimentos Gostarı́amos de agradecer o auxı́lio da FAPEMIG e CNPQ. Referências Annervaz, K. M., Kaulgud, V. S., Misra, J., Sengupta, S., Titus, G., and Munshi, A. (2013). Code clustering workbench. In 13th IEEE International Working Conference on Source Code Analysis and Manipulation (SCAM), pages 31–36. Anquetil, N., Fourrier, C., and Lethbridge, T. C. (1999). Experiments with clustering as a software remodularization method. In 6th Working Conference on Reverse Engineering (WCRE), pages 235–255. Ducasse, S., Girba, T., and Kuhn, A. (2006). Distribution Map. 22nd IEEE International Conference on Software Maintenance (ICSM), 0:203–212. Girvan, M. and Newman, M. E. J. (2002). Community structure in social and biological networks. National Academy of Sciences, 99(12):7821–7826. Lehman, M., Ramil, J., Wernick, P., Perry, D., and Turski, W. (1997). Metrics and laws of software evolution-the nineties view. In 4th International Software Metrics Symposium, pages 20 –32. Mancoridis, S., Mitchell, B. S., Rorres, C., Chen, Y.-F., and Gansner, E. R. (1998). Using automatic clustering to produce high-level system organizations of source code. In 6th International Workshop on Program Comprehension (IWPC), pages 45–52. Mitchell, B. and Mancoridis, S. (2006). On the automatic modularization of software systems using the Bunch tool. IEEE Transactions on Software Engineering, 32(3):193– 208. Parnas, D. (1972). On the criteria to be used in decomposing systems into modules. Communications of the ACM, 15(12):1053–1058. Passos, L., Terra, R., Diniz, R., Valente, M. T., and Mendonca, N. C. (2010). Static architecture conformance checking – an illustrative overview. IEEE Software, 27(5):82–89. Praditwong, K., Harman, M., and Yao, X. (2011). Software module clustering as a multiobjective search problem. IEEE Transactions on Software Engineering, 37:264–282. Russell, S. and Norvig, P. (2009). Artificial Intelligence: A Modern Approach, 3rd edition. Pearson Higher Education. Santos, G., Valente, M. T., and Anquetil, N. (2014). Remodularization analysis using semantic clustering. In IEEE Conference on Software Maintenance, Reengineering and Reverse Engineering (CSMR-WCRE), pages 224–233. Silva, L., Valente, M. T., and Maia, M. (2014). Assessing modularity using co-change clusters. In 13th International Conference on Modularity, pages 49–60. Terra, R. and Valente, M. T. (2009). A dependency constraint language to manage objectoriented software architectures. Software: Practice and Experience, 32(12):1073– 1094. Wiggerts, T. (1997). Using clustering algorithms in legacy systems remodularization. 4th Working Conference on Reverse Engineering (WCRE), pages 33–43. 69 VEM SimMS - Um Jogo Educacional de apoio ao Ensino de Manutenção de Software Diógenes Dias Simão, Dyeimys Franco Correa, Paulo Afonso Parreira Júnior Universidade Federal de Goiás (UFG) – Regional Jataí – Jataí/GO – Brasil [email protected], [email protected], [email protected] Abstract. This paper presents a DEG, SimMS, for teaching Software Engineering, with emphasis on the IEEE 1219 standard for Software Maintenance. Its aim is to provide a different approach for teaching this subject in order to attract the attention of the students to the concepts of this area. In an evaluation conducted with twelve students of Computer Science, it was possible to notice that SimMS has obtained good marks regarding to its usefulness and easiness of use, respectively. 1. Introdução Engenharia de Software (ES) é uma área que se preocupa com os aspectos da produção de um software, desde o levantamento de seus requisitos junto aos stakeholders até a fase de manutenção deste software [Sommerville 2011]. No contexto acadêmico, ES é uma disciplina que contempla grande variedade de termos e conceitos e, por isso, segundo Von Vangenheim e Von Vangenheim (2012), a metodologia mais utilizada para ensino desta disciplina é a ministração de aulas expositivas. Entretanto, pesquisas recentes têm apontado que aulas expositivas raramente satisfazem os desafios relacionados à aprendizagem [Biggs e Tang 2011]. Segundo os autores, quando presentes em aulas apenas expositivas, geralmente, os alunos perdem a concentração em cerca de 15 minutos e a absorção do conteúdo reduz drasticamente. Neste sentido, alguns pesquisadores têm proposto a utilização de Jogos Educacionais Digitais (JEDs), como material de apoio ao processo de ensinoaprendizado [Fernandes e Werner 2009; Savi e Ulbricht 2009; Thiry et al. 2010; Navarro e Hoek 2009; Prikladnicki et al. 2007; Benitti e Molléri 2008]. JEDs podem ser vistos como ferramentas computacionais utilizadas como material didático complementar no aprendizado de alguma área ou de um conjunto de habilidades específicas [Annetta 2010]. A utilização de JEDs tem se mostrado eficiente, pois permite a simulação de ambientes que expõem os alunos a cenários reais, que são difíceis de se reproduzir em sala de aula [Lima et al. 2011]. Na área de ES, os JEDs possuem enfoque em simulações, explorando abstrações, trabalho cooperativo, tomadas de decisão, entre outros [Fernandes e Werner 2009]. Na literatura, há propostas de JEDs para diferentes áreas da ES, tais como Engenharia de Requisitos [Thiry et al. 2010], Medição de Software [Von Wangenheim et al. 2008] e Gerência de Projeto [Navarro e Hoek 2009; Prikladnicki et al. 2007; Benitti e Molléri 2008]. Entretanto, há escassez de trabalhos com enfoque em Manutenção de Software (MS). MS é uma das principais subáreas da ES e tem sido considerada, muitas vezes, como um gargalo no processo de desenvolvimento de um software; segundo Pressman (2011), dados da indústria indicam que entre 50% e 70% de todo esforço gasto em um software são despendidos após ele ter sido entregue ao cliente, ou seja, durante a fase de manutenção. 70 VEM Considerando a escassez de trabalhos relacionados ao ensino de MS e a importância dessa fase para o ciclo de vida de um software, este trabalho tem como objetivo apresentar um JED de apoio ao ensino de MS, denominado SimMS (Simulador de Manutenção de Software). Mais especificamente, o jogo proposto visa a auxiliar alunos quanto ao entendimento dos conceitos relacionados ao processo de Manutenção de Software proposto pela norma IEEE 1219 [IEEE 1998]. Este trabalho está organizado da seguinte forma: na Seção 2 é apresentada uma breve contextualização sobre o processo de MS descrito na norma da IEEE 1219, bem como sobre JEDs. Na Seção 3 são apresentados alguns trabalhos relacionados, juntamente com uma análise comparativa dos mesmos. Nas Seções 4 e 5 são apresentados, respectivamente, o JED SimMS e a avaliação realizada sobre o mesmo. Por fim, na Seção 6 estão as considerações finais e as propostas de trabalhos futuros. 2. Manutenção de Software e Jogos Educacionais Digitais (JEDs) Na Figura 1 são apresentadas as descrições das sete fases do processo para Manutenção de Software descrito na norma IEEE 1219 [IEEE 1998]. Figura 1. Processo para Manutenção de Software segundo a norma IEEE 1219. De acordo com esta norma, observa-se que várias fases devem ser seguidas e documentadas durante o processo de MS. Segundo Paduelli (2007), uma proposta interessante para que conteúdos como este sejam melhor explorados em sala de aula é fundamentá-los por meio da simulação de situações do mundo real. Uma abordagem que tem sido bastante utilizada para se atingir esse objetivo é a utilização de Jogos Educacionais Digitais (JEDs). A norma IEEE 1219 foi escolhida para ser contemplada neste trabalho, pois se trata de um padrão internacional, definido por uma instituição amplamente reconhecida e que tem sido abordada em alguns livros-textos recentes para a disciplina Engenharia de Software [Wazlawick 2013]. Os Jogos Digitais fazem parte de um dos ramos de entretenimento que mais cresce na indústria de software. Com o intuito de atrair a atenção e o comprometimento dedicados aos jogos por seus usuários para as salas de aulas, o número de pesquisas sobre a junção entre entretenimento e ensino com jogos educacionais tem crescido bastante [Savi e Ulbricht 2009; Fernandes e Werner 2009; Mitchell e Savill-Smith 2004]. Porém, realizar esta junção de forma adequada não é uma tarefa trivial. Para que os jogos possam atingir seus objetivos pedagógicos, alguns elementos devem estar presentes nos mesmos, tais como [Annetta 2010]: i) identidade: é importante que o jogador tenha uma identidade dentro do jogo, sendo representado por um personagem (avatar); ii) interatividade: é o elemento que permite a interação do jogador com outros personagens em ambientes de múltiplos jogadores ou com personagens non-player (NPC – Non-Player Character); iii) complexidade crescente: o jogo deve apresentar diferentes níveis de dificuldades, que aumentam conforme o jogador vai desempenhando corretamente o seu papel dentro do jogo; e iv) análise de atuação: é 71 VEM necessário que o jogador receba um feedback sobre o seu desempenho durante e após a finalização do jogo. Na Seção 3 são apresentados sucintamente alguns JEDs de apoio ao ensino de ES existentes na literatura e, ao final, uma análise comparativa destes jogos é apresentada, com base nos elementos descritos anteriormente. 3. Trabalhos Relacionados O primeiro trabalho relacionado a ser destacado consiste no JED “Ilha dos Requisitos” [Gros 2003], cuja história se baseia em um personagem, denominado “Jack Reqs”, que sofre um acidente de avião e cai em uma ilha isolada. Na ilha, há uma tribo de canibais e “Jack Reqs” precisa concluir uma série de tarefas relacionadas à área de Engenharia de Requisitos (ER) para que não seja devorado por estes canibais. Um exemplo de tarefa que deve ser realizada no jogo é colocar na ordem correta as principais atividades de um processo de ER. “Planager” [Prikladnicki et al. 2007] é um jogo que apoia o ensino dos conceitos de gerência de projeto com enfoque no PMBOK (Project Management Body of Knowledge). Durante o jogo, o aluno pode interagir com diversos cenários de Projetos de Software pré-cadastrados. Em cada cenário, existe uma descrição de um projeto de software e o jogador deve passar pelos cinco processos de planejamento do PMBOK (definição do escopo, criação da estrutura analítica do projeto, definição das atividades, sequenciamento de atividades e desenvolvimento do cronograma). O jogo oferece dois módulos, um voltado para o aluno e outro para o professor. No módulo do professor, é possível cadastrar diferentes tipos de cenários de gerenciamento de projetos. “SE-RPG” [Benitti e Molléri 2008] é um jogo desenvolvido no formato RPG (Role-Playing Game) que simula um ambiente de desenvolvimento de software. No “SE-RPG”, é possível que o jogador escolha um avatar, o projeto a ser desenvolvido, o modelo de processo de desenvolvimento (cascata, iterativo ou prototipação), a linguagem de programação a ser utilizada e a equipe de desenvolvimento. Após isso, o jogador deverá atribuir tarefas aos membros da sua equipe, de acordo com o modelo de processo escolhido, com o intuito de finalizar o projeto no menor tempo e com o menor custo possível. Nesta mesma linha, “SimSE” [Navarro e Hoek 2009] é um jogo no qual o jogador assume o papel de um gerente de projeto. No “SimSE”, é permitido ao jogador demitir ou admitir novos empregados, bem como atribuir diferentes tarefas a eles. O jogo permite ainda a comunicação dos membros da equipe para com o jogador, uma vez que eles podem demonstrar sua satisfação ou insatisfação, informar que estão doentes ou cansados; exigindo assim, que jogador tome decisões para manter o gerenciamento do projeto em ordem. Por fim, “X-Med” [Von Wangenheim et al. 2008] é um jogo no qual o jogador assume o papel de um analista de medição, sendo é responsável por realizar a simulação de um programa de medição de software, com base na abordagem GQM (GoalQuestion-Metric). O objetivo do jogo é apoiar o ensino da competência de aplicação do conhecimento de medição de software. No Quadro 1 apresenta-se uma análise comparativa dos JEDs descritos anteriormente, com base nos elementos que devem estar presentes em um jogo educacional [Annetta 2010] (Seção 2), bem como nos seguintes critérios adicionais: i) Tópico de Ensino: quais são os assuntos da ES tratados pelo JED?; ii) Plataforma de Execução: em quais tipos de ambientes o JED proposto pode ser executado (por exemplo, web, desktop ou mobile)?; e iii) Tecnologia de Desenvolvimento: em qual plataforma de desenvolvimento o JED foi construído? 72 VEM Quadro 1. Análise comparativa dos trabalhos relacionados. Critérios/JEDs Identidade Interatividade Complexidade Crescente Análise de Atuação Tópico de Ensino Ilha dos Requisitos X Planager X X SE-RPG + + X-Med X X SimSE X + X + + X + X Engenharia Requisitos Web + Gerência de projeto Desktop X Gerência de projeto Web + Medição de Software Desktop X Gerência de projeto Desktop Plataforma do JED Tecnologia de Flash Java Flash Java Java Desenvolvimento Legenda: Elemento Identificado (+), Elemento parcialmente identificado (-), Elemento não identificado (X). Como pode ser observado no Quadro 1, nenhum dos jogos analisados contempla o ensino de Manutenção de Software, nem contempla, por completo, os critérios apresentados por Annetta (2010) – Seção 2. Outro ponto a ser destacado é que apenas dois jogos foram desenvolvidos para serem executados via web (“Ilha dos Requisitos” e “SE-RPG”) e que a tecnologia utilizada para desenvolvê-los é proprietária (Macromedia Flash). O JED que contemplou mais elementos educacionais foi o “SE-RPG” e o que contemplou menos elementos, foi o JED “Ilha dos Requisitos”. No caso do jogo “Ilha dos Requisitos”, o elemento “Identidade” foi dado como parcialmente contemplado, pois apesar de o jogo fornecer um personagem que identifica o jogador (Jack Reqs), não há representação de identidade para usuários do gênero feminino. Os elementos menos contemplados pelos JEDs analisados foram “Identidade”, “Interatividade” e “Análise de Atuação”, elementos estes fundamentais para que o jogo atinja seus objetivos educacionais. 4. SimMS – Simulador de Manutenção de Software SimMS é um JED single-player cujo objetivo é apoiar o ensino de Manutenção de Software, com ênfase no processo descrito pela norma IEEE 1219 (IEEE, 1998). O jogo simula o ambiente de uma empresa de software, que implementa requisições de manutenção solicitadas por um cliente em um software específico. A meta do jogo é atender às requisições de manutenção previamente cadastradas, de acordo com a norma. SimMS foi desenvolvido sobre a plataforma Java, que foi escolhida por: i) apresentar alta portabilidade; ii) permitir que produtos desenvolvidos nesta linguagem possam ser disponibilizados para serem executados via web (por meio da tecnologia de Applets); e iii) ser constantemente atualizada. Cabe ressaltar ainda que SimMS é software livre e encontra-se disponível para download via web1. 4.1. Apresentação do Jogo Antes de começar a jogar, o jogador tem a opção de abrir um tutorial, no qual são apresentadas as regras do jogo, bem como os principais conceitos sobre MS e sobre a norma IEEE 1219. Após iniciar o jogo, como primeiro passo, o jogador deve informar seu nome e escolher um avatar (do gênero masculino ou feminino) para representá-lo. O(A) jogador(a) assume então o papel de um(a) gerente de equipe de manutenção, responsável por selecionar as tarefas a serem realizadas, a ordem em que elas devem ocorrer e os funcionários que as cumprirão. Após se identificar, o jogador deverá escolher os membros da sua equipe de manutenção, que deve ser composta por quatro funcionários (Figura 2). Cada 1 http://paulojunior.jatai.ufg.br/pages/49922-trabalho-de-conclusao-de-curso 73 VEM funcionário possui experiências (em anos) distintas para os diferentes tipos de atividades relacionadas ao desenvolvimento de software, tais como análise, projeto, implementação e teste. Feita a escolha da equipe, o jogo entra em sua tela principal, apresentada na Figura 3. De tempos em tempos, requisições de manutenção irão chegar e o jogador deverá tratá-las corretamente, conforme explicado mais a frente nesta seção. Há um conjunto de requisições pré-cadastradas no jogo e a cada partida, no máximo cinco requisições deverão ser tratadas pelo jogador. Essa decisão foi tomada para que o jogo não se prolongasse muito e para que o jogador pudesse entender com mais clareza os resultados de suas decisões sobre cada requisição de manutenção recebida. B C A D Figura 3. Escolha do avatar. Figura 2. Escolha da equipe de manutenção. Como pode ser observado na Figura 3 - A, a primeira requisição de manutenção do cliente foi: “Olá. Preciso de uma tela para cadastrar os veículos dos médicos que podem usar o estacionamento. Obrigado!”. A descrição da requisição do cliente é bastante limitada, porém seu objetivo é apenas permitir que o jogador reconheça o tipo de manutenção (perfectiva, corretiva ou adaptativa) com o qual se refere esta requisição. O software que está sob manutenção é o “MedPro”, um sistema de informação hipotético relacionado à área da saúde. O jogador pode ter acesso a uma descrição mais detalhada deste sistema por meio do ícone “MedPro” (Figura 3 – B). Além desta descrição, o jogo apresenta também uma representação fictícia da qualidade da documentação e da taxa de erros do software em manutenção, que podem variar de 0 à 100% (Figura 3 - C). Essas informações são importantes, pois podem direcionar a tomada de decisão do jogador ao longo da partida. Por exemplo, se a legibilidade do código fonte do software é baixa, o jogador pode decidir por realizar uma manutenção preventiva antes de atender a qualquer tipo de requisição do cliente. Uma vez que o jogador leu a requisição do cliente, ele deverá selecionar a tarefa a ser executada e um funcionário para realizá-la. Cada atividade do processo da norma IEEE 1219 possui uma tarefa relacionada no sistema. Além disso, há uma atividade extra, denominada “manutenção preventiva”, que permite aprimorar a qualidade da documentação do software. De acordo com a norma IEEE 1219 [IEEE 1998], o primeiro passo do processo de MS é a “identificação da modificação solicitada”, que consiste em saber se a requisição é do tipo corretiva, adaptativa ou perfectiva. O exemplo da Figura 3 (A) trata de uma requisição do tipo “perfectiva”, uma vez que ela se refere à inclusão de uma nova função no software. A cada atividade realizada pelo jogador, como “ranqueamento”, “análise da viabilidade”, entre outras, dois eventos irão ocorrer: i) atualização da qualidade da documentação e da taxa de erros do software em 74 VEM manutenção; e ii) atualização da quantidade de dias em que o software está sob manutenção (Figura 3 – D). A atualização a ser realizada na qualidade da documentação do projeto, na sua taxa de erros e o tempo para execução de uma atividade dependem da experiência do funcionário que está realizando a tarefa e da qualidade atual da documentação do software legado. Por exemplo, se o usuário selecionar um funcionário com pouca experiência em testes para executar a atividade de “testes de aceitação”, a taxa de erros do software irá aumentar e o tempo para execução desta tarefa será maior do que se um funcionário mais experiente tivesse sido escolhido. Outro aspecto importante a ser observado pelo jogador é que a ordem em que as atividades são realizadas deve estar em conformidade com o que é especificado na norma IEEE 1219. Um exemplo de como a não realização de uma atividade, ou a realização de uma atividade na ordem incorreta, pode prejudicar o desempenho do jogador é quando o mesmo entrega o software sem ter realizado a atividade de “teste de aceitação”. Caso isso ocorra, a taxa de erros do software poderá aumentar após a entrega do software ao cliente. Devido à limitação de espaço, outras características do jogo não puderam ser apresentadas. Mais detalhes sobre o SimMS podem ser encontrados em [Simão 2013]. 4.2 Análise Comparativa do SimMS Com relação aos elementos educacionais da Seção 2, tem-se que: quanto ao elemento “identidade”, no SimMS, o(a) jogador(a) é representado(a) por um(a) gerente de uma equipe de MS, cujo gênero é escolhido pelo próprio usuário. Apesar de o SimMS não fornecer interatividade com outros jogadores, o elemento “interatividade” é contemplado por permitir que o jogador interaja com os personagens non-players, representados pelos membros da equipe de manutenção. Quanto ao elemento “complexidade crescente”, o grau de dificuldade do jogo varia de acordo com os níveis de qualidade da documentação e da taxa de erros do software; quanto pior a qualidade do software, mais tarefas o jogador terá que realizar para completar as requisições com êxito. Quanto ao elemento “análise de atuação”, ao final de cada requisição entregue ao cliente, é fornecido um feedback informando as atividades do processo que foram executadas corretamente ou não pelo jogador. Além disso, ao longo do jogo, o usuário pode observar diretamente o reflexo de suas ações sobre o tempo gasto para realização de cada tarefa e sobre a qualidade da documentação e taxa de erros do software. 5. Avaliação do SimMS Para avaliação do SimMS, o modelo de aceitação de tecnologia TAM (Technology Acceptance Model) [Davis et al. 1989] foi utilizado. Esse modelo possui como objetivo explicar o comportamento das pessoas no que diz respeito à aceitação de uma tecnologia. O modelo TAM define dois constructos básicos: i) utilidade percebida, que mede o quanto uma pessoa acredita que utilizar determinada tecnologia aumenta seu desempenho no trabalho ou estudo; e ii) facilidade de uso percebida, que mede o quanto uma pessoa acredita que o uso de determinada tecnologia é simples. Além disso, o modelo TAM sugere a criação de questionários, para os quais são atribuídas afirmações relacionadas à facilidade de uso e utilidade percebidas da tecnologia em análise. Para cada afirmação, o respondente poderá escolher uma opção na seguinte escala do tipo Likert: “DT - Discordo Totalmente”, “DT - Discordo Parcialmente”, “N - Neutro”, “CP - Concordo Parcialmente” e “CT - Concordo Totalmente”. 75 VEM O questionário desenvolvido para avaliação do SimMS foi respondido por doze alunos de graduação em Ciência da Computação da Universidade Federal de Goiás (Regional Jataí), que passaram pela disciplina “Engenharia de Software”. Os resultados obtidos quanto à facilidade de uso e utilidade percebidas são sumarizados nos gráficos das Figuras 4 e 5, respectivamente. Com relação à facilidade uso percebida (Figura 4), pode-se destacar que 100% dos participantes da avaliação concordaram totalmente que o acesso ao jogo SimMS é fácil. Acredita-se que isso seja devido à escolha da plataforma de desenvolvimento (Java), por meio da qual, pode-se desenvolver um jogo que não requer instalação na máquina do usuário, facilitando assim, o acesso ao mesmo. Além disso, a grande maioria (92%) concordou que utilizar o SimMS é uma boa ideia. Outro ponto importante a ser destacado é que 41% dos avaliadores escolheram a opção “neutro” ou “discordo parcialmente”, quando questionados se mesmo antes de clicarem em um botão, eles sabiam a ação que iria ocorrer. Isso pode indicar que é preciso melhorar a interface do jogo, para que o jogador fique mais seguro de suas ações. Figura 4. Resultados obtidos para o constructo “Facilidade de uso percebida”. Figura 5. Resultados obtidos para o constructo “Utilidade percebida”. Quanto à utilidade percebida, a maioria dos avaliadores (83%) concordaram totalmente que o SimMS pode ser útil no processo de ensino-aprendizagem dos conceitos de MS e pode adicionar valor ao seu estudo. Porém, 16% dos avaliadores discordaram total ou parcialmente, quando lhes foi questionado sobre a utilização do SimMS em sua rotina de trabalho. Isso é compreensível, pois o SimMS foi desenvolvido com a finalidade de fornecer apoio aos alunos das disciplinas envolvidas com MS. Por fim, quando perguntado se os avaliadores recomendariam o SimMS a outras pessoas, 92% responderam positivamente (concordo totalmente). 6. Considerações Finais e Trabalhos Futuros Jogos Educacionais Digitais (JEDs) podem ser uma alternativa promissora como ferramenta de apoio ao processo de ensino-aprendizagem de várias disciplinas, dentre elas, a Engenharia de Software. O JED apresentado neste trabalho, SimMS, pode ser 76 VEM utilizado como ferramenta de apoio ao ensino de Engenharia de Software, bem como outras disciplinas que abordem o tema “Manutenção de Software”. Como propostas de trabalhos futuros, tem-se: i) adaptação do SimMS para tornálo flexível a ponto de permitir que professores possam adicionar novas requisições e novas regras ao jogo; ii) implementação de novos tipos de estratégias de manutenção, como por exemplo, as utilizadas pelos métodos ágeis, como Scrum, XP, entre outros; e iii) implementação de técnicas de Inteligência Artificial para realização dos cálculos de duração dos eventos e pontuação dos usuários. Acredita-se que o jogo pode tornar-se mais realístico com essa melhoria, além disso, espera-se um aumento na complexidade do jogo com a inclusão de novas requisições e novas estratégias de execução da MS. Referências ANNETTA, L. “The “I’s” Have It: A Framework For Serious Educational Game Design”. Review Of General Psychology. 2010. BENITTI, F. B. V.; MOLLÉRI, J. S. “Utilização de um RPG no Ensino de Gerenciamento e Processo de Desenvolvimento de Software”. XXVIII Congresso da SBC. 2008. BIGGS, J.; TANG, C. “Teaching For Quality Learning At University”. 4ª Edição. 480p. McGraw-Hill. 2011. DAVIS, F.D.; Bagozzi, R. P.; Warshaw P.R., “User Acceptance of Computer Technology: A Comparison of two Theoretical Models”. In: Manag. Science. v. 35, n. 8, p. 982-1003, 1989. FERNANDES, L.; WERNER, C. “Sobre o uso de Jogos Digitais para o Ensino de Engenharia de Software”. II Fórum de Educação em Engenharia de Software. 2009. GROS, B. “The Impact of Digital Games in Education”. First Monday: Peer-reviewed Journal on the Internet. 2003. IEEE Std. 1219-1998. “IEEE Standard for Software Maintenance”. Junho/1998. LIMA, T.; CAMPOS, B.; SANTOS, R.; WERNER, C.; Limoeiro, F. “Desenvolvimento de Jogos Educacionais para o Ensino de Engenharia de Software”. X SBGames, 2011. MITCHELL, A.; SAVILL-SMITH, C. “The Use of Computer and Video Games For Learning: A review of the literature”. 84p. Learning and Skills Development Agency. 2004. NAVARRO, E.; HOEK, A. “Multi-Site Evaluation of SIMSE”. 40th ACM Technical Symposium On Computer Science Education. 2009. PADUELLI, M. M. “Manutenção de Software: problemas típicos e diretrizes para uma disciplina específica”. Dissertação de Mestado. Universidade de São Paulo. 2007. PRIKLADNICKI, R.; ROSA, R.; KIELING, E. “Ensino de Gerência de Projetos de Software com o Planager”. XVIII Simpósio Brasileiro de Informática na Educação. 2007. SAVI, R.; ULBRICHT, V. R. “Jogos Educacionais: Benefícios e Desafios”. RENOTE - Revista Novas Tecnologias na Educação. 2009. SIMÃO, D. D. “SimMS – Um Jogo Educacional Digital de Apoio ao Ensino de Manutenção de Software”. Monografia de Graduação. UFG/Regional Jataí. Jataí/GO. 2013. SOMMERVILLE, I. “Engenharia De Software”. 9ª Edição. 568p. Pearson Education. 2011. THIRY, M.; ZOUCAS, A.; GONÇALVES, R. “Promovendo a Aprendizagem de Engenharia de Requisitos de Software através de um Jogo Educativo”. XXI Simpósio Brasileiro de Informática na Educação. 2010. VON WANGENHEIM, C. G.; VON WANGENHEIM, A. “Ensinando Computação com Jogos”. Bookess. 2012. VON WANGENHEIM, C. G.; THIRY, M.; KOCHANSKI, D. “Empirical Evaluation of an Educational Game on Software Measurement”. Empirical Softw. Eng. 14, 4, 418-452. 2008. WAZLAWICK, R. S. “Engenharia de Software: conceitos e práticas”. 368p. Campus. 2013. 77 VEM ProFap-R: Um Processo de Reengenharia de Código Orientada pela Reengenharia de Dados Eduardo Moreira Fernandes, Ygo Aquino Brito, Inara Santana Ortiz, Nathalia Leite B. de M. Borine, Maria Istela Cagnin1 Faculdade de Computação – Universidade Federal de Mato Grosso do Sul (UFMS) Caixa Postal 549 – 79.070-900 – Campo Grande – MS {eduardomorfernandes, ygo1992, inara.ortiz, nathaliaborine}@gmail.com, [email protected] Abstract. Legacy systems are computational systems that offer relevant services for organizations, but are considered obsolete because of their older technologies. Furthermore, they use to have high complexity and cost of maintenance. Aiming to evolve legacy systems, different techniques are used as the software reengineering. This work presents a process of code reengineering oriented by data reengineering for midrange systems. This process was successfully applied in the reengineering of a specific Web system of the domain of social management. Resumo. Sistemas legados são sistemas computacionais que oferecem serviços de alta relevância para as organizações, porém considerados obsoletos por suas tecnologias ultrapassadas. Além disso, possuem geralmente alto grau de complexidade e elevado custo de manutenção. Com o intuito de evoluir sistemas legados são empregadas técnicas como a reengenharia de software. O presente trabalho apresenta um processo de reengenharia de código orientada pela reengenharia de dados para sistemas legados de médio porte. Esse processo foi aplicado com sucesso na reengenharia de um sistema Web específico do domínio de gestão social. 1. Introdução Sistemas legados são sistemas computacionais que oferecem serviços de alta relevância para organizações, mas são considerados obsoletos por conta de suas tecnologias ultrapassadas. Também são caracterizados por seu alto grau de complexidade e elevado custo de manutenção, devido a fatores como a falta de documentação disponível e a dificuldade de atualização das tecnologias empregadas no desenvolvimento do sistema original [Pressman 2011; Sommerville 2011]. Com intuito de modernizar sistemas legados e garantir manutenibilidade, são empregadas técnicas como a reengenharia de software [Chikofsky e Cross 1990], composta basicamente pelas etapas de engenharia reversa e engenharia avante. Na primeira, o sistema legado é representado por artefatos de alto nível de abstração. Na segunda, é feita a engenharia avante do sistema tomando como base os artefatos da etapa anterior. Além disso, a reengenharia de software provê documentação atualizada, renovação das tecnologias empregadas e reestruturação do sistema. 1 Apoio financeiro da Fundect (Fundação de Apoio ao Desenvolvimento do Ensino, Ciência e Tecnologia do Estado de Mato Grosso do Sul) - T.O. nº 0072/12. 78 VEM A principal motivação deste trabalho foi a reengenharia do Sistema de Informação em Gestão Social (SIGS), o qual é um sistema Web de médio porte com desenvolvimento iniciado no ano 2000 pelo Instituto de Estudos Especiais (IEE) da Pontifícia Universidade Católica de São Paulo (PUC-SP). Esse sistema é considerado obsoleto principalmente pelas tecnologias ultrapassadas com as quais foi implementado. A reengenharia do SIGS foi motivada durante a execução de um projeto de pesquisa voltado ao Sistema Único de Saúde (SUS) [Cagnin et al. 2012], e está sendo realizada no Laboratório de Engenharia de Software (LEDES) da Universidade Federal de Mato Grosso do Sul (UFMS). Inicialmente se propôs a adição de novas funcionalidades ao SIGS, relacionadas a área da saúde, para obtenção de relatórios com informações sociais e de saúde para apoiar tomadas de decisão de gestores de ambas as áreas. No entanto, observou-se a inviabilidade disso devido à baixa qualidade do código do SIGS (código replicado e inutilizado, falta de padronização, design deteriorado por manutenções, etc.) e das tecnologias obsoletas empregadas. Então, optou-se pela reengenharia desse sistema. Considerando-se a complexidade de portar o código legado do SIGS para uma linguagem moderna, foi conduzida uma pesquisa por processos de reengenharia para sistemas de médio porte cuja reengenharia do código fosse baseada na reengenharia de dados. Isto pois, segundo Pérez-Castillo et al. (2013), bancos de dados existentes não devem ser descartados durante a modernização de software, pois contêm valioso conhecimento do negócio não presente em outro lugar. No entanto, processos desse tipo não foram encontrados. Assim, o processo colaborativo de manutenção de software ProFap [Cagnin et al. 2013], definido e utilizado no LEDES, foi adaptado para o contexto de reengenharia e é apresentado neste artigo. O processo resultante dessa adaptação, nomeado como ProFap-R, propicia a reengenharia de código baseada na reengenharia de dados com o intuito de viabilizar a reengenharia de sistemas de médio porte, como é o caso do SIGS. A escrita deste artigo está organizada em mais sete seções. Na Seção 2 são apresentados alguns trabalhos relacionados a processos de reengenharia. Na Seção 3 é apresentado o sistema SIGS legado. Nas Seções 4 e 5 são apresentados, respectivamente, o ProFap e o ProFap-R. Na Seção 6 é descrita a condução da reengenharia do SIGS com o apoio do ProFap-R. Por fim, na Seção 7, é feita uma conclusão acerca do presente trabalho. 2. Trabalhos Relacionados Processos de reengenharia de software têm sido definidos nos últimos anos para modernizar sistemas legados desenvolvidos em plataforma desktop ou Web para a plataforma web baseada ou não em serviços, utilizando tecnologias atuais. Ruiz et al. (2012) apresentam um arcabouço de reengenharia que a partir do sistema legado (as-is system) obtém modelos em um nível mais alto de abstração (as-is models), caracterizando a engenharia reversa. Em seguida, melhorias podem ser incorporadas nesses modelos para adequá-los às necessidades atuais da organização (tobe models). Após isso, a engenharia avante do sistema é realizada com base nos modelos to-be e em um modelo de processo de desenvolvimento de software (por exemplo, cascata, espiral, incremental, etc.), obtendo-se o sistema pós-reengenharia (tobe system). Rodríguez-Echeverría et al. (2011) apresentam um arcabouço para a 79 VEM modernização sistemática de aplicações Web para aplicações RIAs2 (Rich Internet Applications). Basicamente, o principal objetivo do arcabouço proposto é gerar uma aplicação cliente RIA a partir das camadas de navegação e de apresentação da aplicação Web legada e permitir a comunicação entre a sua camada de conexão orientada a serviço com a camada da lógica do negócio do lado do servidor. Por outro lado, PérezCastillo et al. (2013) propõem um processo de reengenharia que, em linhas gerais, recupera serviços Web a partir de bases de dados legadas. Os serviços Web identificados gerenciam acesso às bases de dados legadas sem descartá-las. Com isso, bases de dados legadas podem então ser usadas por sistemas de informação modernizados em ambientes orientados a serviços. No entanto, pelas buscas realizadas não foram encontrados trabalhos direcionados à reengenharia de sistemas de médio porte nos quais a reengenharia de dados conduz a reengenharia de código, que é o foco deste trabalho. 3. SIGS Legado O SIGS é um sistema de informação de âmbito social que oferece um controle de dados eficaz, visando o auxílio do monitoramento, da sistematização e da avaliação de programas sociais. Em plataforma Web, oferece às prefeituras e às instituições sociais um conjunto de serviços como o cadastro e o acompanhamento das famílias incluídas nos programas. O SIGS é somente acessado pelos profissionais das instituições que o utilizam, e não pela população em geral, havendo rigoroso controle de acesso por permissões de usuários. Inicialmente, o SIGS foi orientado à gestão de programas sociais estaduais de complementação de renda pela Secretaria de Assistência Social da Prefeitura de São Paulo, de 2002 a 2004. Em seguida, passou a ser utilizado em vários programas no Estado de MS a partir de uma parceria realizada entre a PUC e a UFMS: Vale Universidade, Vale Universidade Indígena, Unidades Socioeducativas, dentre outros. No contexto do uso do SIGS, agentes sociais são responsáveis pela coleta de dados obtidos junto à população, e os dados são cadastrados no SIGS por técnicos responsáveis. Depois do registro dos dados, relatórios gerenciais são fornecidos pelo sistema. O SIGS foi desenvolvido utilizando as tecnologias ASP e SGBD (Sistema de Gerenciamento de Banco de Dados) SQL Server 2000, que são proprietárias e atualmente obsoletas. Esse sistema pode ser considerado de médio porte pois possui 498.769 LOC e 383 tabelas. 4. Processo ProFap O ProFap, proposto por Cagnin et al. (2013), consiste de um processo colaborativo de manutenção com integração de ferramentas de apoio a diversas atividades e foco no desenvolvimento colaborativo de software. Ele tem sido amplamente utilizado por diversos projetos do LEDES, em especial, o projeto do SIGFAP (Sistema de Informação de Gestão de Fundações de Amparo à Pesquisa), que atualmente está sendo utilizado por Fundações de Amparo à Pesquisa de doze estados do país. O ProFap é 2 RIAs possuem plataforma baseada na Web 2.0 e oferecem principalmente interfaces de usuário com alto nível de usabilidade e interação, e processamento e armazenamento de dados no lado do cliente. 80 VEM dividido em etapas, cada uma com procedimentos específicos e possui um fluxo conforme ilustrado na Figura 1. Após a implantação da versão inicial do ProFap, diversas propostas de melhorias foram identificadas pelos membros do LEDES. Uma dessas melhorias consiste na adição da etapa “Projetar Solução”, explicada mais à frente. Assim, o ProFap após as melhorias é composto de seis etapas, conforme apresentadas na Figura 1. Para apoiar as etapas do ProFap, faz-se uso de ferramentas de desenvolvimento de software integradas, tais com o Redmine (para gerenciamento de projetos e bugs) e o Git (sistema de versionamento de código e artefatos). Na etapa “Solicitar Manutenção”, é feita a solicitação via Redmine de novas funcionalidades do sistema ou o reporte de bugs. Se a solicitação for relativa a manutenção corretiva, então será atribuída a um desenvolvedor. Se referente ao desenvolvimento de módulo ou funcionalidade inédita, então será avaliada por comitês na etapa “Aprovar Solicitação de Manutenção”. Nessa etapa, uma solicitação pode ser aprovada ou cancelada. Na etapa “Projetar Solução”, após aprovação de uma solicitação, esta é atribuída a um desenvolvedor. Nela, desenvolvedores com tarefas atribuídas relacionadas entre si discutem a melhor forma de projetar a solução para atender tais tarefas, com auxílio dos líderes de equipe que possuem conhecimento detalhado do domínio do sistema. Em paralelo à etapa “Projetar Solução”, ocorre a etapa “Implementar Solução e Efetuar Testes de Unidade”. Nessa etapa, a solução projetada na etapa anterior é implementada com auxílio da ferramenta Git. Testes funcionais e unitários devem ser feitos pelo desenvolvedor, em seu Ambiente Local, durante a implementação da solicitação. Nessas etapas, pode ocorrer via Redmine comunicação entre cliente e desenvolvedor. Na etapa “Efetuar Testes de Integração e de Aceitação” é feita atualização do ambiente de testes, via Git integrado ao Redmine, com o resultado do trabalho. Após isso, são feitos testes de integração no ambiente de testes. O desenvolvedor poderá solicitar apoio de outras equipes de desenvolvimento para os testes de aceitação. Esse tipo de teste é sempre feito pelo cliente. Por fim, na etapa “Finalizar Tarefa de Manutenção”, ocorre o encerramento da solicitação de manutenção via Redmine e uma nova versão do sistema é atualizada no ambiente de produção utilizando o Git. Figura 1. ProFap: Processo Colaborati vo de Manutenção (adaptado de Cagnin et al. (2013)) 81 VEM 5. Processo ProFap-R O processo proposto neste artigo, ProFap-R, é uma adaptação do ProFap para apoiar a reengenharia de código orientada pela reengenharia de dados. Para sua elaboração, foram concebidas novas etapas em relação ao ProFap, e outras foram adaptadas de acordo com as necessidades da reengenharia, conforme a Figura 2. As mesmas ferramentas de apoio utilizadas no ProFap (Figura 1) podem ser utilizadas no ProFap-R. Figura 2. ProFap-R: Processo de Reengenharia de Código Orientada pela Reengenharia de Dados Na etapa “Obter entendimento geral do sistema legado”, é obtido um amplo entendimento do domínio do sistema e são decididas as tecnologias que serão utilizadas na reengenharia. A etapa “Solicitar Manutenção” do ProFap foi desdobrada em três etapas: i) “Estudar as tabelas do banco de dados legado”: a equipe de desenvolvimento realiza um entendimento do sistema legado e documenta as suas tabelas; ii) “Priorizar as tabelas do banco de dados legado”: as tabelas documentadas são priorizadas das menos às mais dependentes. Essa priorização determinará a ordem de submissão à reengenharia das tabelas e funcionalidades associadas a elas, a fim de facilitar a migração do sistema com menos esforço; iii) “Atribuir tarefas de manutenção”: tarefas de manutenção são atribuídas aos desenvolvedores de acordo com a priorização realizada. O entendimento de cada funcionalidade e das regras de negócio associadas é baseado na execução do sistema legado e descrito na própria tarefa. Na etapa “Aprovar Solicitação de Manutenção”, é necessário que as funcionalidades submetidas à reengenharia sejam aprovadas pelo cliente, para que funcionalidades não representativas dos processos de negócio atuais não sejam encaminhadas à reengenharia. Caso o cliente não esteja presente e/ou disponível, essa etapa é desconsiderada. Na etapa “Projetar Solução”, são avaliadas as tabelas do sistema legado relacionadas à solicitação de manutenção, a fim de definir as tabelas do sistema pós-reengenharia. Para isso, são: eliminadas redundâncias das tabelas do sistema legado seguindo regras de normalização de bancos de dados; padronizados os nomes dos campos; definidos os tipos de dados correspondentes ao novo SGBD adotado, se for o caso, entre outros. Caso algum framework de aplicação [Fayad e Johnson 2000] no domínio do sistema legado tenha sido selecionado para apoiar a reengenharia, o projeto das funcionalidades deve ser baseado no projeto do mesmo. Na etapa “Implementar Solução e Efetuar Testes de Unidade”, as tabelas associadas à manutenção são migradas para o novo SGBD. Em alguns casos o script de criação do banco de dados legado pode ser reutilizado totalmente ou parcialmente. Porém, nos casos em que o banco de dados não está normalizado e sem padronização nos nomes de tabelas, campos, chaves primárias e estrangeiras, sugere-se escrever um novo script. As funcionalidades são implementadas de acordo com o projeto definido na etapa anterior e com base na descrição das regras de negócio realizada na etapa 82 VEM “Atribuir tarefas de manutenção”. Caso algum framework de aplicação no domínio do sistema legado tenha sido selecionado, o mesmo é utilizado para apoiar a implementação. Na etapa “Implementar Solução e Efetuar Testes de Unidade” dados de tabelas do sistema legado podem ser reaproveitados para povoar tabelas do sistema pósreengenharia. As etapas “Efetuar Teste de Integração e Aceitação” e “Finalizar Tarefa de Manutenção” do ProFap-R são similares ao processo ProFap. 6. Reengenharia do SIGS O processo ProFap-R foi utilizado na reengenharia do SIGS, a qual foi realizada por bolsistas (assumindo o papel de equipe de desenvolvimento do processo) do projeto de pesquisa mencionado na Seção 1, com o auxílio de um dos clientes envolvido no desenvolvimento do SIGS (assumindo o papel de cliente do processo). No início, foi executada uma análise das funcionalidades básicas do SIGS legado e a quantidade de tabelas no banco de dados, visando definir as tecnologias a serem empregadas na reengenharia. Na Figura 3 são ilustradas as arquiteturas do SIGS legado e do SIGS pósreengenharia. A arquitetura do SIGS legado (Figura 3 (a)) não seguiu padrões de projeto e há vários trechos de código não utilizados. Além disso, o SIGS legado possui base de dados única, acessada por várias instituições que oferecem recursos e programas sociais. Dependendo da quantidade de acessos simultâneos ao sistema e à sua base de dados, pode ocorrer queda do servidor ou aumento do tempo de resposta às consultas, além da possibilidade de colocar em risco a segurança das informações, caso as regras de segurança sejam violadas. Na reengenharia do SIGS, foi estabelecido o uso de tecnologias multiplataformas e livres, bem como mudanças na arquitetura, como mostrado na Figura 3 (b). Considerando a facilidade que frameworks de aplicação oferecem à engenharia avante de sistemas legados [Cagnin et al. 2003], foi utilizado neste trabalho o Titan Framework, que utiliza linguagens PHP e XML, para apoiar a reengenharia do SIGS. Esse pertence ao domínio e-gov [Carromeu et al. 2010] e utiliza o padrão de projeto MVC (Model-View-Controller). Basicamente, o Titan recebe como entrada arquivos de configuração (XML e SQL) da instância. Com isso, ele possibilita configurar as regras de negócio da nova aplicação editando o arquivo XML e, se isso não for suficiente, é possível programar novos componentes de software que podem ficar disponíveis ou não no repositório do framework, dependendo da sua generalização. O uso do Titan ofereceu diversas vantagens como maior controle de permissões dos usuários, organização do projeto em camadas MVC (explicitadas na Figura 3 (b) por retângulos com diferentes cores de cinza) e boa usabilidade da interface com o usuário. Com a arquitetura estabelecida para a reengenharia, cada instituição possui uma instância do SIGS, consequentemente, o banco de dados é exclusivo para cada uma delas, dirimindo os problemas do SIGS legado. As atribuições de tarefas aos desenvolvedores e a documentação delas foram realizadas por meio da ferramenta Redmine na etapa “Solicitar Manutenção” e começaram após a primeira análise do sistema (etapa “Obter entendimento geral do sistema legado”). Essas atribuições foram definidas em reuniões semanais e de acordo com o grau de dependência das tabelas da base de dados legada, iniciando pelas tabelas 83 VEM menos dependentes e finalizando pelas mais dependentes. Todas as atas das reuniões também foram adicionadas ao Redmine como tarefas do tipo “reunião”. (a) Legado (b) Pós-Reengenharia Figura 3. Arquiteturas do SIGS Após as atribuições das tarefas, o cliente aprovou a realização das mesmas, como descrito na etapa “Aprovar Solicitação de Manutenção”. Nessa etapa, algumas funcionalidades do SIGS legado foram rejeitadas para a reengenharia, pois não correspondiam mais às necessidades do cliente. Durante a etapa “Projetar Solução”, os desenvolvedores tomavam as decisões nas reuniões semanais onde as atribuições das tarefas eram realizadas. Soluções eram traçadas com base na descrição da tarefa e no projeto do Titan. Na fase “Implementar Solução e Testes de Unidade”, a equipe de desenvolvimento criou os scripts das tabelas associadas a cada tarefa de manutenção e informou os parâmetros necessários no arquivo de configuração em XML do Titan. Logo após a implementação, foram realizados os testes unitários. Na etapa “Efetuar Testes de Integração e de Aceitação” foram conduzidos testes de integração pela equipe de desenvolvimento e testes de aceitação em conjunto com o cliente, a fim de avaliar e garantir consistência e qualidade do produto. Após concluir cada tarefa, uma nova versão do produto era disponibilizada no ambiente de produção, de acordo com a etapa “Finalizar Tarefa de Manutenção”. Foram contabilizadas 29.074 linhas de código (LOC) e 134 tabelas implementadas no SIGS pós-reengenharia, o que dá uma redução de 94% em LOC e 65% na quantidade de tabelas. Essa redução deve-se à reestruturação do banco de dados após uma análise refinada (anteriormente, o banco de dados atendia cada instituição onde o SIGS era implantado), mudança da linguagem de programação utilizada e adoção de um framework com reaproveitamento de componentes, além da remoção de funcionalidades não mais necessárias. Em todas as etapas do ProFap-R foi elaborada documentação relacionada diretamente à reengenharia do SIGS e também à condução do processo em si, como tomadas de decisão, feedbacks do cliente e atas de reuniões. Toda documentação produzida foi registrada e versionada no Git via Redmine. 7. Conclusão Este artigo apresentou o processo ProFap-R, que é um processo de reengenharia de código baseado na reengenharia de dados, podendo ser apoiado por frameworks do domínio do sistema legado. Esse processo permitiu com sucesso a condução da 84 VEM reengenharia de um sistema de médio porte, com o apoio do Titan Framework por alunos de graduação não especialistas em reengenharia. Isso foi possível devido à simplicidade e flexibilidade tanto do processo proposto quanto das ferramentas a ele associadas. Acredita-se que o ProFap-R possa também ser aplicado na reengenharia de sistemas de grande porte. Para a obtenção de melhores resultados com o uso do ProFapR recomenda-se utilizar um framework no domínio do sistema legado cuja arquitetura seja adequada para a reengenharia. São sugeridos os seguintes trabalhos futuros: i) descrever estratégias de teste de regressão e associá-las à etapa “Efetuar Teste de Integração e Aceitação”; ii) explicitar no processo ProFap-R outras ferramentas computacionais que podem ser utilizadas para apoiar cada etapa; e iii) conduzir estudos de casos de reengenharia com sistemas de grande porte para averiguar a eficiência do ProFap-R nesses casos. Referências Cagnin, M. I., Maldonado, J., Germano, F., Penteado, R. (2003). PARFAIT: Towards a Framework-based Agile Reeng. Process. In: Agile Develop. Conf., Salt Lake City, Utha. Cagnin, M. I., Acosta, A., Gonçalves, C., Vieira, C., Blanes, D., Smaka, E., Sandim, H., Luna, J., Costa, K., Alvarenga, M., Silva, M., Oliveira, M. (2012). Gestão de Inf. das Famílias Beneficiadas no Prog. da Saúde da Família no Município de Campo GrandeMS. Proj. Pesq. Aprovado no Edital FUNDECT/DECIT-MS/CNPq/SES N° 04/2012. Cagnin, M. I., Turine, M., Silva, M., Landre, G., Oliveira, L., Lima, V., Santos, M., Paiva, D., Carromeu, C. (2013). ProFap: Processo Colaborativo de Manutenção de Software. In: X Workshop de Manutenção de Softw. Moderna (WMSWM'2013), Salvador, Bahia. Carromeu, C., Paiva, D. M. B., Cagnin, M. I., Rubinsztejn, H. K. S., Turine, M. A. S., Breitman, K. (2010). Component-Based Architecture for e-Gov Web Systems Development. In: 17th IEEE International Conf. and Workshops on Eng. of ComputerBased Systems, Oxford, UK. Chikofsky, J. E., Cross, J. H. (1990). Reverse engineering and design recovery: A taxonomy. IEEE Software, v. 7, n. 1, p. 13-17. Fayad, M. E.; Johnson, R. E. (2000). Domain-specific application frameworks: Frameworks experience by industry. John Wiley & Sons, 1ª ed. Guido, A.L., Paiano, R., Pandurino, A., Mainetti, L. Transforming legacy systems into usercentred web applications (2010). Management of the Interconnected World - ItAIS: The Italian Association for Information Systems, p. 395-401. Pérez-Castillo, R., de Guzmán, I., Caballero, I., Piattini, M. (2013). Software modernization by recovering Web services from legacy databases. Journal of Software: Evolution and Process, v. 25, n. 5, p. 507-533. Pressman, R. S. (2011). Engenharia de Software: Uma Abordagem Profissional. McGraw Hill, 7ª ed. Rodríguez-Echeverría, R., Conejero, J., Clemente, P., Preciado, J., Sánchez-Figueroa, F. (2011). Modernization of legacy web applications into rich internet applications. In: 7th Model-Driven Web Engineering Workshop, 7059 LNCS, 236-250, Paphos, Cyprus. Ruiz, M., Espanã, S., Gonzalez, A. (2012). Model-driven organisational reengineering: A framework to support organisational improvement. In: 38th Latin America Conference on Informatics, Medellín-Colômbia. Sommerville, I. (2011). Engenharia de Software. Pearson Education Brasil, 9ª ed. 85 VEM Influencing Factors on Code Smells and Software Maintainability: A Cross-Case Study Tassio Vale1 , Iuri Santos Souza2 , Cláudio Sant’Anna2 1 Centro de Ciências Exatas e Tecnológicas - CETEC Universidade Federal do Recôncavo da Bahia (UFRB) - Cruz das Almas, BA - Brazil 2 Departamento de Ciência da Computação - DCC Universidade Federal da Bahia (UFBA) - Salvador, BA - Brazil [email protected], [email protected], [email protected] Abstract. Code smell is a concept referring to code that needs refactoring and can degrade aspects such as understandability and changeability. To the best of our knowledge, there is a lack of qualitative studies investigating influencing factors and mitigation strategies for code smells, that play an important role to improve software evolution, quality and productivity. As consequence, this paper investigates, in real-world scenarios, influencing factors for code smells based on a software developer point-of-view. We performed three case studies by interviewing software developers from three different real-world systems, by collecting both qualitative and quantitative data to generate reliable research evidence. 1. Introduction Code smell is a concept referring to code that needs refactoring and can degrade aspects such as understandability and changeability [Fowler et al. 1999]. In addition, it can be related to software faults. Code smell detection approaches [Yamashita and Counsell 2013] and tools [Fontana et al. 2011] are suitable indicators of the need for maintenance in a way that other purely metric-based approaches lack. In the literature, there are proposals investigating the relationship among code smells and maintainability. Evidence point software with bad smells are more changeprone than others [Khomh et al. 2009], and components infected by code smells exhibit a different change behavior [Olbrich et al. 2009]. In particular, architecture is influenced by code smells, since they often entail modularity problems in the evaluated systems [Macia et al. 2011]. [Zhang et al. 2011] performed a literature review, analyzing the most relevant papers in this area. The evidence indicate there is a higher research attention for specific smells such as Duplicated Code, and little attention on other ones (e.g. Message Chains). In addition, their findings show very few studies report on the impact of code smells in software development. There is a lack of qualitative studies investigating influencing factors and mitigation strategies for code smells, that play an important role to improve software evolution, quality and productivity. In order to mitigate code smells in a given software, it is important to identify and manage factors that influences the emergence of them. Such 86 VEM influencing factors might be since time pressure for releasing a software until lack of information about code smells and their associated risks. Consequently, a causality analysis in real-world scenario from both qualitative and quantitative perspectives is essential. This paper investigates factors that influence the emergence of code smells and possible mitigation strategies based on a software developer point-of-view. We applied a cross-case analysis to investigate multiple case studies seeking for empirical evidence on a specific context. Three cases provided qualitative and quantitative data from different real software development projects, with different developers. These results can indicate which factors should be managed, in order to decrease the emergence of smells in source code and consequently decreasing maintainability issues. The remainder of this paper is structured as follows: first, we present related work. Section 3 describes the activities of the proposed the research design. Section 4 presents findings from our analysis, and Section 5 synthesizes the gathered evidence. Section 6 argues on threats to validity of this research. Finally, Section 7 summarizes findings and presents future work. 2. Related Work [Katzmarski and Koschke 2012] investigate whether metrics agree with complexity as perceived by programmers. Their findings point programmers’ opinions are quite similar and only few metrics and in only few cases reproduce complexity rankings similar to human raters. Our work focus on the influencing factors instead of analyzing the metrics associated to code smells. [Yamashita and Moonen 2012] reports on an empirical study that investigates the extent to which code smells reflect factors affecting maintainability that have been identified as important by programmers. Furthermore, [Sjoberg et al. 2013] reported an empirical study that investigated the relationship between code smells and maintenance effort using the same study object from [Katzmarski and Koschke 2012]. According to [Zhang et al. 2011], the research attention is turned to code smells and related maintainability issues. We investigate influencing factors, what makes a software development environment proper for these code anomalies. Our assumption is discovering those factors, we can mitigate code smells and improve maintainability. 3. Research Design This work takes a constructivist or interpretive philosophical perspective, assuming there are multiple interpretations of a single event [Merriam 2009]. We performed three case studies by interviewing software developers as well as gathering quantitative data from three different real-world systems. The case studies are instrumental, since we intend to understand the construct and build theories. After, a cross-case analysis [Eisenhardt 1989] synthesize evidence and present findings. The main research question reflects the goal of this work, and it is derived in three specific questions, described as following: • Main question: Which factors influence the emergence of code smells according to the software developer point-of-view? 87 VEM – RQ1: What do software developers know about code smells? Rationale: our hypothesis is knowledge about code smells might influence developers opinions, since they cannot see the impact of code smells on software maintainability. Additionally, the absence of knowledge can be an influencing factor. – RQ2: Which factors influence which code smells? Rationale: in this question, we investigate the relationship of each code smell with the respective influencing factor(s). The developers should also explain why a given factor is related to a specific code smell. – RQ3: How to manage these influencing factors? Rationale: considering developers’ experience, besides indicating factors that influence the emergence of code smells, they are also able to propose mitigation strategies for this context. These evidence can be evaluated in future research. 3.1. Data Collection The first source of evidence for data collection is the set of metrics associated to code smells. Code smell detection tools provide results for such metrics. In this study, we adopted the inCode tool1 . A brief definition of each code smell [Lanza et al. 2005, Fowler et al. 1999] analyzed by inCode is described as follows: Code smells related to class analysis: Data class is the manifestation of a lacking data encapsulation, and of a poor datafunctionality proximity. By allowing other modules or classes to access their internal data, data classes contribute to a brittle, and harder to maintain design. Tradition breaker when a derived class breaks the inherited “tradition” and provide a large set of services which are unrelated to those provided by its base class Schizophrenic class is a class that captures two or more key abstractions. It negatively affects the ability to understand and change in isolation the individual abstractions that it captures. God class is a design flaw refers to classes that tend to centralize the intelligence of the system. A God Class performs too much work on its own, delegating only minor details to a set of trivial classes and using the data from other classes. Code smells related to method analysis: Feature envy refers to methods that seem more interested in the data of other classes than that of their own class. These methods access directly or via accessor methods a lot of data of other classes. Data clumps They represent groups of data that appear together over and over again, as parameters that are passed to operations throughout the system. They represent cases of bad/lacking encapsulation and have a negative contribution on the ease of maintaining those parts of the system that use the data clumps (by Fowler). 1 inCode tool - Available at http://www.intooitus.com/products/incode/ 88 VEM Sibling duplication means duplication between siblings in an inheritance hierarchy. Two or more siblings that define a similar functionality make it much harder to locate errors because the assumption ‘only class X implements this, therefore the error can be found there”does not hold anymore. Internal duplication means duplication between portions of the same class or module. For example, an operation that offers a certain functionality should be solely responsible for that functionality. External duplication means duplication between unrelated capsules of the system. Message chains corresponds to the situation in which a method calls many data exposer methods that belong to other classes (i.e. including also accessor methods, but not limited to these, as data exposers can be also static methods, that return an object that is part of that class). The second source of evidence is the opinion of software developers concerning the research questions. As data collection instrument, we applied interviews with software developers, our unit of analysis. Interviews are effective to elicit information about things that cannot be observed, such as feelings, thoughts, and intentions [Merriam 2009]. The interviews are semi-structured, considering open questions to guide the interviewer. It gives freedom on the sequence of the questions and exact wording, allowing the extraction of useful and rich information. Two researchers conduct the interviews: the interviewer, asking questions and talking directly with interviewees, and the another researcher taking notes of expressions, behavior and gestures of the interviewees. The researchers conduct interviews by initially running the inCode tool and collecting the results. After, they start the interview asking a set of five questions to obtain the developer background and a description of the analyzed software. Then, the interviewer shows the code smell quantitative results and, for each detected code smell, asks the next five questions concerning whether he consider it as a code smell, influencing factors and mitigation strategies. Finally, the interviewer try to get an overall opinion from the interviewee through the last two questions. 3.2. Data Analysis The qualitative data analysis aims to interpret data obtained from different sources. This activity follows incremental and iterative steps. This work performed several iterations for data collection and analysis. Furthermore, the techniques used for data analysis come from basic qualitative research. In this sense, coding, categorization and synthesis are based on [Corbin and Strauss 2008]. The analysis activities aim to build categories, that can be themes, patterns or findings. We adopted the coding technique for categories construction. Coding consists of making notations in parts of the data that leads to potentially relevant information for answering the research questions [Merriam 2009]. The codes identified from each interview were compared to codes in other interviews. The constant comparison is a way to group codes into specific categories that represent the influencing factors of code smells as well as mitigation strategies for them. As the process of data analysis progressed, relationships among categories were built, leading to explanatory propositions. Finally, core categories were chosen according 89 VEM to their general explanatory power, propositions emerged and a narrative was created to describe the central story of the case. We then interrogated this narrative to build a proposal of strategy to increase motivation in the organization. 3.3. Cross-Case Analysis The cross-case method analyzes multiples cases studies seeking for empirical evidence on a specific fact [Yin 2008], synthesizing data, drawing inferences, and providing recommendations [Eisenhardt 1989]. It enables researchers to take a look beyond the initial insights, developing concrete findings based on them. [Yin 2008] emphasize that if similar results are found in both analyzed studies, the findings can be considered robust. The benefits of adopting a cross-case approach [Glaser and Strauss 1967] are: ensuring evidence accuracy, establishing the generality of a fact, clarifying the relevant particulars of a case, testing some theory, and generating a theory (or establishing some definitions that should be followed). The procedure adopted in this study is to select pairs of cases to the analysis, looking for similarities and differences among each pair [Eisenhardt 1989]. As result, we could identify new categories and concepts about the fields under study, which the investigators had not foreseen so far in the individual settings of each case study. 4. Results and Findings Following the previously described research protocol, we present as follows the results of three investigated cases. 4.1. Case #1: National Transplant System The National Transplant System (SNT) is a federal system responsible for managing the distribution of grafts for organ donation over the country. The software development team comprises five developers, and the system has implemented around nine thousand methods. The inCode quantitative results pointed the following code smels for SNT: Data Class, Schizophrenic Class, God Class, Feature Envy, Data Clumps, Sibling Duplication, Internal Duplication, External Duplication and Message Chain. Such results were used to interview two developers (with eight and six years of experience) of this team. Considering Data Class, the developers consider this is not a code smell. According to them, classes present this characteristic due to architectural decisions, and every system has classes representing business domain data. Additionally, they state Data Clumps is not a code smell, since separate groups of data in specific classes does not make sense. For Sibling Duplication, the developers pointed the tool results as an error because it does not analyze classes semantically, and the presented duplications are semantically appropriate. However, there are different opinions between the developers for Feature Envy. One developer states Feature Envy needs to be solved, and it was resulting from a bad design decision. The other developer understand this smell as a good design decision. For the next five code smells, the developers agree they are relevant problems in the source code. Schizophrenic Class, God Class and Message Chain emerge due to architectural and design decisions, and specific refactoring can mitigate it. The influencing 90 VEM factors for Internal Duplication are certain technologies to support the system development and the lack of experience of some developers in the team. Training can help to mitigate this issue. External Duplication present different factors: lack of understanding on business processes and rules as well as low priority to perform refactoring and mitigate it. 4.2. Case #2: Dental Information System RadioWeb is a software to support dentists during cephalometry and radiograph by applying specific annotations in such exams. This software has around seven hundred methods and built by a freelancer (the interviewee, with eight years of experience). The inCode quantitative results pointed the following code smells for RadioWeb: Data Class, Schizophrenic Class, God Class, Feature Envy, Internal Duplication, External Duplication and Message Chain. Data Class and Feature Envy are not a code smells, according to the interviewee, since they comprise correct design decisions. According to the developer, Schizophrenic Class, God Class and Message Chain emerge due to design decisions, and specific refactoring can mitigate it. Internal Duplication is caused by lack of understanding on business processes and rules, and influencing factor for External Duplication is the adopted technology to implement the system. 4.3. Case #3: UML Sequence Diagram Generator Lirio is an academic project that consists of a compiler to generate UML sequence diagrams using information from the source code of a given software. This project was developed by two undergraduate students in one year. The inCode quantitative results pointed the following code smells for Lirio: Data Class, God Class, Feature Envy, Data Clumps, Internal Duplication and External Duplication. One of the developers, with ten years of experience, was interviewed. The developer stated Data Class is not a code smell, since it is a good design decision concentrating data representation in specific classes. Furthermore, he does not agree with tool results for Internal Duplication, since it does not perform semantic analysis in the methods. On the other hand, God Class is a code smell emerging due to short deadlines and lack of business understanding. Lack of communication among team members influences the emergence of Feature Envy. In addition, Data Clumps and External Duplication are result of bad design decisions. According to the developer, specific refactoring and longer deadlines are essential to mitigate these code smells. 5. Cross-Case Synthesis The first question (RQ1) investigates the understanding of code smells by the participants. The results point different levels of understanding considering the list of smells addressed in this paper. However, such a difference did not influence their opinion about the importance of code smells and the respective quantitative results for software maintainability. According to them, the results guide stakeholders to seek solutions for common issues (code smells) in a given system, and it consolidated the existence of problems they already knew. 91 VEM The second question, RQ2, aimed to identify the influencing factors on code smells. Considering the factors previously described in the respective cases, the participants also identified general aspects that can influence the emergence of any code smell. A consolidated list of factors is presented next: • Short deadlines and time pressure to deliver software; • Bad architectural decisions, that represent implementation decisions in a higher level of granularity (e.g. at a component level, adopted technology); • Bad design decisions, that represent implementation decisions in a lower level of granularity (e.g. concentration of business rules into specific methods or classes); • Lack of understanding of the business; • Lack of experienced developers; • Lack of refactoring effort after achieving a specific requirement; • Low priority to software quality; The last question (RQ3) focused on identifying how to mitigate the code smells and the respective influence factors. Most of the mitigation strategies concerned specific refactoring that we could not generalize. The participants also proposed the following strategies: additional time for refactoring in the development schedules, higher priority for software quality, better understanding of the adopted technologies and training for inexperienced developers. 6. Threats to Validity We discuss four threats to validity in this study [Yin 2008]: construct validity, internal validity, external validity, and reliability. For construct validity, our cross-case design considers multiples sources of evidence in the data collection (quantitative data, interview and field notes) as a way of encouraging convergent lines of inquiry. Considering internal validity, our strategy consisted of using data analysis results to make possible inferences by using strategies such as coding-causal loop diagram on the evidence, textual explanation-building and discussion-validation. Despite the generalization of the findings is not possible, we applied the case study protocol in three different real-world scenarios to address external validity. Reliability was addressed by developing a detailed research protocol, in order to clarify all activities of this cross-case analysis. 7. Conclusions This paper presented a qualitative and quantitative approach to investigate influencing factors of code smells based on a software developer point-of-view. Participants opinions point code smells and the quantitative information around them are important to improve software maintainability. Furthermore, we identified a set of factors that influence the emergence of code smells and possible strategies to mitigate them. As future work, we intend to have a better understanding on mitigation strategies for code smells. In addition, despite of applying the research protocol in different scenarios, it needs to be applied in other different contexts to improve external validity, since we considered only systems implemented in the Java language. 92 VEM References Corbin, J. M. and Strauss, A. L. (2008). Basics of qualitative research. Sage Publ., 3. ed. edition. Eisenhardt, K. M. (1989). Building Theories from Case Study Research. The Academy of Management Review, 14(4):532–550. Fontana, F., Mariani, E., Morniroli, A., Sormani, R., and Tonello, A. (2011). An experience report on using code smells detection tools. pages 450–457. Fowler, M., Beck, K., Brant, J., Opdyke, W., and Roberts, D. (1999). Refactoring: Improving the Design of Existing Code. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA. Glaser, B. G. and Strauss, A. L. (1967). The Discovery of Grounded Theory: Strategies for Qualitative Research. Aldine Transaction, 8th printing edition. Katzmarski, B. and Koschke, R. (2012). Program complexity metrics and programmer opinions. In Program Comprehension (ICPC), 2012 IEEE 20th International Conference on, pages 17–26. Khomh, F., Di Penta, M., and Gueheneuc, Y.-G. (2009). An exploratory study of the impact of code smells on software change-proneness. In Proceedings of the 2009 16th Working Conference on Reverse Engineering, WCRE ’09, pages 75–84. IEEE Computer Society. Lanza, M., Marinescu, R., and Ducasse, S. (2005). Object-Oriented Metrics in Practice. Springer-Verlag New York, Inc., Secaucus, NJ, USA. Macia, I., Garcia, A., Von Staa, A., Garcia, J., and Medvidovic, N. (2011). On the impact of aspect-oriented code smells on architecture modularity: An exploratory study. In Software Components, Architectures and Reuse (SBCARS), 2011 Fifth Brazilian Symposium on, pages 41–50. Merriam, S. B. (2009). Qualitative research: a guide to design and implementation. Jossey-Bass higher and adult education series. Jossey-Bass. Olbrich, S., Cruzes, D., Basili, V., and Zazworka, N. (2009). The evolution and impact of code smells: A case study of two open source systems. pages 390–400. Sjoberg, D., Yamashita, A., Anda, B., Mockus, A., and Dyba, T. (2013). Quantifying the effect of code smells on maintenance effort. Software Engineering, IEEE Transactions on, 39(8):1144–1156. Yamashita, A. and Counsell, S. (2013). Code smells as system-level indicators of maintainability: An empirical study. Journal of Systems and Software, 86(10):2639–2653. Yamashita, A. and Moonen, L. (2012). Do code smells reflect important maintainability aspects? In Proceedings of the 28th IEEE International Conference on Software Maintenance (ICSM), ICSM ’12, pages 306–315. IEEE Computer Society. Yin, R. K. (2008). Case Study Research: Design and Methods (Applied Social Research Methods). Sage Publications, fourth edition. edition. Zhang, M., Hall, T., and Baddoo, N. (2011). Code bad smells: A review of current knowledge. Journal of Software Maintenance and Evolution, 23(3):179–202. 93 VEM How developers deal with Code Smells: the case of the SourceMiner Evolution team Alcemir Rodrigues Santos1 , Mário André de Freitas Farias1,3 , Eduardo Santana de Almeida1,2 , Manoel Mendonça1,2 , Claudio Sant’Anna1,2 1 Federal University of Bahia (UFBA) Software Engineering Laboratory (LES) 2 3 Fraunhofer Project Center (FPC) Federal Institute of Sergipe (IFS) {alcemirsantos, marioandre, esa, mendonca, santanna}@dcc.ufba.br Abstract. Context. Identify code smells has occupied researcher mind all over the world. Goal. In this paper we tackled this problem aiming to gather evidence on software metrics use and the developers refactoring intention due the presence of code smells. Method. We performed a controlled experiment with the team of developers of a medium sized software system. Results. Our results showed that although metrics can help developers, which metric is most useful seems to be a personal choice. In addition, code smells may only affect the refactoring decision of less experienced developers. 1. Introduction A challenge for software engineers and programmers is to assure quality and maintainability for complex and large software systems [Sjoberg et al. 2013]. Such task often implies problems regarding communication, compatibility, and complexity issues [Lanza et al. 2005]. Therefore, ensuring the maintainability of software systems is not a trivial task, and improving this process is a continuous work of research in the software maintainability area. In general, while software evolves with a complex design, developers may introduce design problems (e.g., code smells). Sometimes, these code smells can cause maintainability obstacles to be transposed on the pursuit of code quality goals, such as understandability and changeability [Fowler 1999]. In this sense, researchers had been tackling such problems from different perspectives, either through (i) defining automatic strategy for detecting code smells [Lanza et al. 2005, Marinescu 2004], (ii) trying to understand how developers identify code smells [Santos et al. 2013], (iii) understanding software to improve the maintainability based on code smells evaluations [Sjoberg et al. 2013], or (iv) pursuing better ways to identify smells with metrics supporting develepers evaluation [Guo et al. 2010]. In this context, we performed an empirical study to investigate how developers identify code smells and to discuss the effectiveness of automatic code smells detection tools, such as inCode and inFusion1 . Section 2 describes the study settings. In this sense, we enumerate the research questions guiding our study as follows. 1 Both inCode and inFusion are available at: www.intooitus.com. We use InCode (v3.8). It takes the source code and rely on Lanza et al. [Lanza et al. 2005] strategies of smells detection. 94 VEM RQ1 Do developers converge with the automatic code smells identification? RQ2 What strategies do developers use to find code smells in their software? RQ3 Does the code smells identification imply in the developers intention of refactoring? In summary, we used these questions to build the contributions (see Section 3) of this paper as follows. We fostered the discussion (i) on the factors affecting the code smell identification, (ii) on the developers reliance of software metrics in this process; and (iii) on the drivers of the developers refactoring intention. We concluded the paper by discussing the threats to validity (Section 4) and by answering the research questions (Section 6). 2. Study Settings In this section, we present the setting of our study. More specifically, we discuss (i) the target system analyzed; (ii) the characterization of the subjects; (iii) the controlled experiment design; and (iv) the code smells we addressed in the investigation. 2.1. SourceMiner Evolution SourceMiner Evolution2 (SME) [Novais et al. 2013] is a software visualization tool that provides support to software evolution tasks, aiming to ease software maintenance. It was primarily implemented in Java as an Eclipse plugin in more than 20 KLOC. We choose SME because of convenience, since we could easily access the developers and mainly because it is not a trivial system and represent wide range of software systems. Table 1 characterizes the SME tool by presenting software metrics values addressing different quality attributes, such as complexity, coupling and inheritance. We chose these metrics because they are well known [Chidamber and Kemerer 1994, Lanza et al. 2005], easy to understand and depict a wide view of our target system. Table 1. Essential metrics values of SourceMiner Evolution. Quality Attribute Metric Acronym Metric Name Size NOP LOC NOC NOM Number of Packages Number of Lines of Code Number of Classes Number of Methods Value 36 23.878 296 1.730 2.2. Subjects Characterization We called the seven SME developers to participate voluntarily. One developer did not answer the call and another could not attend due to lack of schedule, all others attended. Each developer worked on different parts of SME with eventual intersections. Those who attended the call have different formal education: a Ph.D. student (Dev2); a M.Sc. student (Dev1); and three undergraduate students (Devs 3, 4, and 5). Dev2 leads the project and advised the three undergraduate students during their work. We refer to them as DevX (X = [1..5]) for now on. 2.3. Experimental Design We designed our (quasi-)experiment following Wohlin [Wohlin et al. 2012] guidelines. First, we carried out a pilot study and then the experiment itself. The pilot study was 2 Software developed at Software Engineering Lab (LES): www.les.dcc.ufba.br 95 VEM carried out with two master students which did not know the SME source code in advance. They had different performances leading the pilot study to inconclusive results. The pilot study took too long so that we calibrate the experiment task by reducing the number of code smells instances analyzed by the participants. The study included two code smells: God Class (when a class tends to concentrate functionality from several unrelated classes, while at the same time increasing coupling in the system) and Data Class (when the class is a "dumb" data holders, without complex functionality, but which are usually heavily relied upon by other classes in the system) [Lanza et al. 2005]. These smells are easy to understand and wide used in the literature. In the experiment itself, we split the subjects into ”trained” and ”under-training” developers relying on the characterization form data. We considered trained those developers with a long-term training in code smells and with a large software industry experience working on projects performing different roles, such as Quality Assurance Analyst, Project Manager, Requirements Analyst (Devs 1 and 2). The under-training developers are still looking forward to achieve their Computer Science degree and started to program back in high school (Devs 3, 4 and 5). These developers reported fewer than two years on average of experience with development and differently from the trained developers, they reported few knowledge about code smells and refactoring. For the experiment we used inCode to provide classes with smells. We chose this tool because it provide better support among the tools analyzed. Next, we elaborated the list of classes (10 classes) submitted to the developers analysis by putting together classes with and without code smells. We randomly selected the classes whithout any smell. The task assigned to the developers was the inspection of SME and the fulfillment of the questionnaire (discussed in details in the next Section) accordingly. Additionally, we provided printed support material to all of them before the execution of the experiment: the definition of the code smells addressed and the metrics available to their use. We allowed them to keep the material during the experiment. During the experiment, we provided the metrics values calculated by inCode and make clear that its use were optional. We did not performed a formal training to avoid bias [Santos et al. 2013]. The experiment itself consists of accomplish the assigned task of fulfill an questionnaire about code smells in SME, which we describe next. 2.4. Applied Questionnaire We considered different aspects to build the questionnaire used in our experiment aiming to gather useful information to answer our research questions. More specifically, we take into consideration: (i) the agreement with the inCode smells identification for each class; (ii) the agreement between the developers groups regarding their own identification of code smells; (iii) their intention to refactor the classes they pinpointed as containing code smells; (iv) the grading of the severity of the code smells, accordingly with their own criteria to match with the inCode values; (v) the developers opinion if metrics helped them to perform the smells identification. To support replication, we provide the questionnaire in http://goo.gl/TkDPUd. The applied questionnaire consists of nine questions. We enumerated the questions as follows. (Q1) Does this class contain this smell? (Q2) How much does this class seem a smell to you? (Q3) Would you refactor these classes? (Q4) If answered Yes in Q3, 96 VEM grade this class according to the emergency of refactoring (order as you would refactor). (Q5) Did you work in this class? (Q6) What drove you to your answer in Q1? (Q7) Did metrics help you to judge the classification of each class? (Q7.a) Which metrics set was useful to judge “Data Class”? (Q7.b) Which metrics set was useful to judge “God Class”? 3. Results In this section we (i) describe the collected data and (ii) analyze the gathered information through different viewpoints. 3.1. Collected Data Table 2 shows developers judgement about the presence or absence of the code smells addressed in our controlled experiment. For each developer there is three columns relating developers and the classes analyzed: GC, DC and W. The GC and DC columns show whether the developer identified the God Class and Data Class code smells for each given class or not. The severity of the code smell setted by the developer fulfills each cell. The W column shows whether the developer worked in that class during the SME development or not. For example, Dev2 indicated the presence of God Class and Data Class in the ProjectStatistic class with severities equals to one and ten, respectively, and did not worked in the class. Dev5 and Dev4 did not point out the severity of some code smells they identified during the experiment, which we represent with a hyphen (-). The column O presents an oracle regarding the automatic analysis provided by the inCode tool. Additionally, Table 2 presents precision (p), recall (r) and f1 -score of the developers’ judgements. Such metrics rely on the values of ”true positives (tp)” — when the code smell assigned by the participant was also pointed out by inCode —, ”false positives (fp)” — when the code smell assigned by the participant was not pointed out by inCode —, and “false negative (fn)” — when inCode pointed out the code smell to the class but the participant did not. In fact, while precision indicates the fraction of code smells correctly identified (tp/(tp + f p)), recall indicates the fraction of the existing occurrences identified (tp/(tp + f n)). Moreover, the f1 -score is an harmonic mean between precision and recall (2 ∗ p ∗ r/(p + r)), i.e., as much as they get higher, the F1 -score increases itself. Table 2. Developers judgement on the code smells addressed and its respective values of precision, recall and accuracy. Classes O TreeMapView PackagesFilter TreeMapModel ConcernDiffModel CouplingLayoutView ConcernFilterView CouplingModel ProjectStatistic PolimetricLayoutView InterfacesFilter GC DC GC (10) GC GC DC (10) Precision Recall F1 -score GC Dev1 DC W GC 4 4 4 Dev2 DC W GC (7) 4 (10) (10) (2) 4 (8) 4 (5) (5) (10) Dev3 DC W GC 4 (8) 4 4 4 (9) 4 (-) (7) (7) (7) (1) (2) 4 (10) # 0 # .57 1 .73 1 .33 .50 .80 1 .89 1 1 1 4 4 (-) (-) (-) 4 4 (10) (10) Dev5 DC W 4 (-) 4 4 (10) 4 (7) 1 .50 .67 GC 4 4 DC W (9) (10) 4 Dev4 DC 4 (9) 1 .75 .86 1 1 1 (10) .75 .75 .75 1 1 1 O: inCode oracle; GC: God Class; DC: Data Class; W: Worked? Table 3(a) shows another excerpt of the collected data: the developers intention to refactor the classes analyzed in the experiment. The checked cells indicate that the 97 VEM developer intends to refactor the class. The numbers inside the parentheses depict the ordering of refactoring assigned by the developer. The (-) means that the Dev2 did not inform the refactoring sequence. The questionnaire results for all questions is available in http://goo.gl/TkDPUd. Table 3. (a): Developers refactoring intention and (b): Metrics use ocurrences. (a) (b) Classes Dev1 Dev2 Dev3 Dev4 Dev5 TreeMapView PackagesFilter TreeMapModel ConcernDiffModel CouplingLayoutView ConcernFilterView CouplingModel ProjectStatistic PolimetricLayoutView InterfacesFilter 4(1) 4(-) 4(1) 4(-) 4(-) 4(3) 4(4) 4(1) 4(3) 4(1) 4(4) 4(2) 4(-) 4(-) 4(4) 4(2) 4(5) 4(5) 4(6) 4(3) 4(5) 4(2) 4(6) 4(2) LOC WOC CW NOACCM NOPUBA CPFD TCC GC DC 3 2 1 2 3 1 2 4 1 1 GC: God Class; DC: Data Class. 3.2. Data Analysis The collected data built a rich set of information, from which we present a rationale through this section. For instance, we discuss the data taking into consideration (i) the profile and previous experience of the developers, (ii) the developers self-evaluation, and (iii) the developers refactoring intention. 3.2.1. Developers Profile and Experience The values of F1 -score (Table 2) show that the under-training developers achieved closer results to the oracle than the other group. In other words, developers with lower formal education level and less industry experience obtained more correct answers according to the oracle (inCode). Similar experience produced similar beliefs [Passos et al. 2013], which might influenced on the similar judgement. Thus, both groups might have developed different beliefs from their work and academic environment, which may have positively influenced the judgement of the under-training developers. We also believe that, in contrast with the developers of the under-training group, the trained developers have different industry and academia experiences and such difference contributed to different beliefs, which might have increased the disagreement inside the latter group. Such different beliefs contributed to the heterogeneous strategies used by the developers to identify the code smells. While, some rely on the use of metrics, others prefer code inspection, and there were also those who to mix both approaches. We found that most developers resort on metrics, Dev1 was the exception. He is the most experient and used source code inspection and his experience to assess code smells. In contrast, all the others perform an intensive use of metrics. Developers 3, 4 and 5 pointed out the metrics LOC and TCC as important to identifying God Class and developers 3 e 4 pointed out CW as important to identify Data Class. Such metrics were the most cited among the developers. Despite developers reliance on the software metrics, Table 3(b) shows that the choice of the metrics is personal, since developers reported different sets of metrics to assess each code smell. The metrics reported were ”Lines of Code (LOC)”, ”Weighted Operation Count (WOC)”, ”Class Weight (CW)”, ”Number of Accessor Methods (NOACCM)”, ”Number of Public Attributes (NOPUBA)”, Capsules Providing Foreign Data (CPFD), and ”Tight Capsule Cohesion (TCC)”. 98 VEM 3.2.2. Developers Self-Evaluation Another finding in the experiment was about the self-evaluation. We identified that even though the trained developers said they had a good level of knowledge about smells, the under-training developers – whose claim otherwise – achieved better results. One possible explanation to their lack of confidence is their low level of formal education. By investigating the developers characterization data collected we reached a consensus that under-training developers resort to the use of metrics to reinforce his judgement about the code smells. The fact of the under-training developers lack of confidence in their knowledge in code smells might have lead them to rely his judgement on metrics. Moreover, such behavior guide them to higher agreement with the tool. 3.2.3. Refactoring Intention Regarding the refactoring intention, we proceeded with individual analysis for each developer as follows. Dev1 intended to refactor only the classes pointed out as containing code smells, which might imply that he only considered code smell an anomaly that may be harmful to the system. Differently from Dev1, Dev2 intended to refactor mainly the classes he identified a code smell which he attributed high severity. The only exception was the ConcernDiffModel class, which he justifies its refactoring because he knows the class presented too many problems in its evolution history. Dev3 only intended to refactor the Data Classes with higher severity and all God classes, excepting CouplingLayoutView. Although he assigned the same severity for the god classes CouplingLayoutView and ConcernFilterView, he gave no explanation why he would refactor only one of them. In fact, none of the developers intend to refactor CouplingLayoutView. Dev4 decided to refactor all the classes identified either with “God Class” or “Data Class”. Dev5 also intended to refactor all classes that contain code smells. It seems that code smells do not drive developers with higher experience to refactoring. Instead, they would apply refactoring in the pieces of code with defect reincidence whether it contain a code smell or not. On the other hand, less experienced developers seem clearly guided by the code smells identification. In fact, their lack of experience might lead them to hold their judgement based on the existence of code smells instead of actual defects or flaws. 4. Threats to Validity Despite all the caution in controlled (quasi-)experiments, they still present threats to validity [Wohlin et al. 2012]. In this section we discuss those we identified during our study as follows. Conclusion validity. We believe the questionnaire was properly built to achieve the expected answers to our research questions. For instance, it allow us to detect the reliance of the unexperienced developers on the use of software metrics as support for the classes assessment. Therefore, we tried to bypass such threat to conclusion validity relying our analysis only in the information gathered with the subject’s answers. 99 VEM Construct validity. Regarding the experiment planning we made an effort to minimize communication among the subjects aiming to reduce the interference among their answers. In addition, we tried to include all the developers of the system analysed in order to get a wide analysis of the system regarding the code smells from different perspectives. Moreover, we clearly explained the process and introduced the support material – available during the experiment execution – to avoid misguidance of the subjects. In fact, we elaborated a simple and direct questionnaire to ease the understanding of the assigned task. Internal validity. We only discuss data gathered with the questionnaire to assure a causal relationship between the treatment and the result. Otherwise, other factors – uncontrolled and unmeasured – may influence in the analysis. Therefore, to avoid influence from external factors (e.g. participants comunication) we choose to carry the questionnaire as a controlled (quasi-)experiment. Such decision allows us to draw more confident conclusions, despite the fact we interviewed a small sample of developers. External validity. Our study interviewed a small sample of developers what is the biggest threat to the external validity. Therefore, we can not generalize our conclusions. However, in the same time, the reinforced internal validity allows us to draw insights to guide further investigations. 5. Related Work Different work have already tackled the problem of code smells identification at source code level [Lanza et al. 2005, Katzmarski and Koschke 2012, Santos et al. 2013]. For instance, Lanza et al. [Lanza et al. 2005] proposed strategies to help the automation of such identification. Their strategies were implemented into the inCode tool, which performs automatic identification of code smells. Katzmarski and Koschke [Katzmarski and Koschke 2012] try to measure the agreement between developers and different metrics. More specifically, the question addressed is whether program aspects measured by software metrics can be used to determine program complexity from the perspective of programmers. Santos et.al. [Santos et al. 2013] carried a controlled experiment study on detection of the God Class code smell. They concluded that subjects take different drivers to judge a whether a class is a God Class or not. Differently our study focus on the agreement between the developers and the automatic detection with a tool support. 6. Final Remarks and Future Work We are aware of the threats to validity and we answer the research questions to foster the discussion on the topic rather than make a generalizable claim. With regard to RQ1 we found by the values of precision and recall that ”under-trainning” developers judgement seems more likely to agree with the inCode automatic judgement. Instead of adopt a systematic approach, it was the “experience” and “knowledge confidence on software design and code harmfulness” that guided the “trained” developers. Such different factors produce different strategies of inspection for each developer. Therefore, we prefer to suggest further investigation concerning RQ2 since our study lack of evidence on this matter, and whichever claim would be only researchers opinions. In addition, we noticed that the presence of code smells only affect the less experienced developers refactoring intention (RQ3 ). 100 VEM By taking into consideration the evidence gathered we can draw some research opportunities on the topic: (i) what factors influence the beliefs of developers? (ii) what factors drive developers to refactoring? (iii) how much the developers’ previous knowledge in the source code and their experience can help them to identify smells? (iv) how researcher can discuss in-depth about developers’ beliefs on whether a code smell exists or not; (v) replicate the experiment with a larger sample and other systems. Besides that, there is also a need to discuss whether code smells reported are really a design problem in the developers’ point of view. Acknowledgemnts: This work was partially supported by the National Institute of Science and Technology for Software Engineering (INES), funded by CNPq, grants 573964/2008-4, Universal Project (grants 486662/2013-6) and is made possible by the Cooperation Agreement #1/2012 between the Science, Technology and Innovation Secretariat of the State of Bahia, the Fraunhofer-Gesellschaft and the State of Bahia. References [Chidamber and Kemerer 1994] Chidamber, S. R. and Kemerer, C. F. (1994). A metrics suite for object oriented design. Transactions of Software Engineering, pages 476–493. [Fowler 1999] Fowler, M. (1999). Refactoring: improving the design of existing code. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA. [Guo et al. 2010] Guo, Y., Seaman, C., Zazworka, N., and Shull, F. (2010). Domainspecific tailoring of code smells: An empirical study. In Proc. of the 32nd Int’l. Conf. on Software Engineering - Vol.2. ACM. [Katzmarski and Koschke 2012] Katzmarski, B. and Koschke, R. (2012). Program complexity metrics and programmer opinions. In Proc. of the 20th Int’l. Conf. on Program Comprehension, pages 17–26. [Lanza et al. 2005] Lanza, M., Marinescu, R., and Ducasse, S. (2005). Object-Oriented Metrics in Practice. Springer-Verlag New York, Inc., Secaucus, NJ, USA. [Marinescu 2004] Marinescu, R. (2004). Detection strategies: metrics-based rules for detecting design flaws. In Proc. of 20th IEEE Int’l. Conf. on Software Maintenance, pages 350–359. [Novais et al. 2013] Novais, R., Nunes, C., Garcia, A., and Mendonça, M. G. (2013). Sourceminer evolution: A tool for supporting feature evolution comprehension. In Proc. of 29th IEEE Int’l. Conf. on Software Maintenance, pages 1–4. [Passos et al. 2013] Passos, M. C. M., Cruzes, D. S., Hayne, A., and Mendonça, M. G. (2013). Recommendations to the adoption of new software practices: A case study of team intention and behavior in three software companies. In Proc. of the Int’l. Symp. on Empirical Software Engineering and Measurement, pages 1–10, Baltimore, USA. [Santos et al. 2013] Santos, J. A. M., de Mendonça, M. G., and Silva, C. V. A. (2013). An exploratory study to investigate the impact of conceptualization in god class detection. In Proc. of the 17th Int’l. Conf. on Evaluation and Assessment in Software Engineering, pages 48–59. [Sjoberg et al. 2013] Sjoberg, D., Yamashita, A., Anda, B., Mockus, A., and Dyba, T. (2013). Quantifying the effect of code smells on maintenance effort. Transactions on Software Engineering, 39(8):1144–1156. [Wohlin et al. 2012] Wohlin, C., Runeson, P., Höst, M., Ohlsson, M. C., Regnell, B., and Wesslén, A. (2012). Experimentation in Software Engineering. Springer Berlin Heidelberg. 101 VEM Um Método para Identificação de Bad Smells a partir de Diagramas de Classes Henrique Gomes Nunes1 , Mariza A. S. Bigonha1 , Kecia A. M. Ferreira2 , Flávio Airjan Madureira1 1 2 Departamento de Ciência da Computação – Universidade Federal de Minas Gerais Departamento de Computação – Centro Federal de Educação Tecnológica de Minas Gerais {henrique.mg.bh,airjanmadureira}@gmail.com, [email protected] [email protected] Abstract. Este trabalho propõe um método para a identificação de bad smells, via métricas de software e seus respectivos valores referência, em sistemas orientados por objetos a partir de diagramas de classes. O método proposto foi avaliado em dois estudos: um com o objetivo de analisar os resultados do método aplicado a versões antigas e versões refatoradas de um conjunto de seis sistemas de software abertos; e outro para comparar os resultados do método com a análise manual. Os resultados sugerem que o método proposto mostra-se útil para a identificação dos bad smells considerados neste trabalho. Resumo. This work defines a method and a tool to identify bad smells, using software metrics, in class diagrams. We carried out two studies to evaluate the proposed method: the first one aimed to evaluate the results of our method when applied to old versions as well as to refactored versions of six open source projects; in the second study, we compared the results of our method with the results of manual inspections. The results suggest that our method is able to identify the bad smells analyzed in this work. 1. Introdução Para Fowler [Fowler 1999], bad smell é um indicador de um possível problema estrutural em código-fonte, que pode ser melhorado via refatoração. Com o objetivo de contribuir para aprimorar a qualidade dos sistemas de software, alguns trabalhos têm sido desenvolvidos para identificar bad smells em software com o uso de métricas a partir de código fonte [Marinescu 2002, Lanza et al. 2006]. Todavia, é importante que problemas sejam identificados o mais cedo possível no ciclo de vida de um software como por exemplo na fase de modelagem, para que os problemas nas fases posteriores do desenvolvimento de software sejam reduzidos. Para isso, ser capaz de obter métricas a partir de modelos da UML é essencial [Soliman et al. 2010]. Dentre os diagramas definidos na UML, destaca-se o diagrama de classes, que representa classes de objetos e suas relações. A análise desse diagrama pode fornecer métricas relacionadas à manutenibilidade e complexidade do software logo no início do projeto. Porém, um projeto real necessita de uma ferramenta para automatizar este processo, pois é inviável calcular tais métricas manualmente. 102 VEM O presente trabalho visa contribuir com a solução para o problema de identificar problemas estruturais em software a partir de modelos UML, em particular, a partir dos diagramas de classes. Para atingir esse objetivo, neste trabalho (1) foi definido um método de identificação de bad smells em sistemas de software a partir de diagrama de classes, aplicando métricas de software e seus valores referência e, (2) foi desenvolvida uma ferramenta denominada UMLsmell para permitir automatizar a coleta de métricas e a aplicação delas na identificação dos bad smells a partir de diagramas de classes. O método e a ferramenta propostos foram avaliados por meio de experimentos com sistemas de software abertos. 2. Método Proposto Para a definição do método proposto, inicialmente foram identificados, dentre os bad smells descritos na literatura, aqueles que podem ser aplicados a modelos de classe da UML. Foram selecionados três deles: • God Class: corresponde a classes com alta responsabilidade no sistema. Esse bad smell está associado às métricas que permitem avaliar se uma classe possui muitos métodos e se muitas classes dependem da classe avaliada. • Indecent Exposure: ocorre quando uma classe está mal encapsulada. Esse bad smell está associado às métricas de atributos públicos que permitem avaliar o encapsulamento das classes. • Shotgun Surgery: refere-se a classes que ao serem alteradas causam impacto em outras classes. Este bad smell está associado às métricas de relacionamentos do tipo aferentes que permitem avaliar se a alteração em uma classe implicará em alterações em outras classes. 2.1. Valores Referência Neste trabalho foram utilizadas as seguintes métricas: Número de Conexões Aferentes (NCA), Número de Métodos Públicos (NMP) e Número de Atributos Públicos (NAP). A razão para a escolha dessas métricas é que elas são aplicáveis a diagramas de classes e possuem valores de referência previamente definidos na literatura (Tabela 1). As métricas NCA, NMP e NAP permitem identificar os bad smells God Class, Shotgun Surgery e Indecent Exposure. Os valores referência usados foram definidos por Ferreira et al. [Ferreira et al. 2012]. A principal razão da escolha desses valores referência é que eles foram avaliados empiricamente anteriormente. Ferreira et al. [Ferreira et al. 2012] definiram valores referência para estas métricas e os classificaram como: bom, representando os valores mais frequentes para métricas em sistemas de software de boa qualidade; regular, correspondendo a valores pouco frequentes para métricas em sistemas de software de boa qualidade; ruim, correspondendo a valores raros para métricas em sistemas de software de boa qualidade. A idéia das faixas sugeridas como valores referência por Ferreira et al. é que uma vez que os valores são frequentes em sistemas de software, isso indica que eles correspondem à prática comum no desenvolvimento de software de alta qualidade, o que serve como um parâmetro de comparação de um software com os demais. Da mesma forma, os valores pouco frequentes indicam situações não usuais na prática, portanto, pontos a serem considerados como críticos. 103 VEM Métrica Bom NCA até 1 NAP 0 NMP até 10 Regular 2 a 20 1 a 10 11 a 40 Ruim superior a 20 superior a 10 superior a 40 Table 1. Valores referência definidos por Ferreira et al. [Ferreira et al. 2012]. (a) (b) (c) Figure 1. Estratégia de detecção para: (a) God Class, (b) Shotgun Surgery e (c) Indecent Exposure. Neste trabalho, optou-se por considerar as faixas regular e ruim dos valores referência propostos por Ferreira et al. [Ferreira et al. 2012] na identificação de bad smells porque tais faixas correspondem a situações não usuais na prática de desenvolvimento de software. 2.2. Estratégias de Detecção As estratégias de detecção propostas são apresentadas na Figura 1. As métricas que definem a estratégia de detecção do bad smell God Class consideram seus relacionamentos com outras classes e o tamanho da classe avaliada. O God Class é identificado via métricas NCA e NMP. A métrica NCA verifica a influência da classe avaliada sobre as outras classes do software, ou seja, a quantidade de classes que usam os serviços da classe avaliada. A métrica NMP permite avaliar o tamanho de uma classe e a quantidade de serviços a oferecer pela quantidade de métodos. Caso as duas métricas avaliadas estejam dentro da faixa regular ou ruim de acordo com os valores referência, o God Class é considerado como crítico. Caso contrário, a classe não é considerada como problemática. O Shotgun Surgery é identificado via métrica NCA, que define quantas classes dependem da classe avaliada, uma vez que quando uma classe é alterada, todas as outras classes que dependem dela estão sujeitas a mudanças. O Indecent Exposure é um bad smell referente à falta de encapsulamento de classes. Um bom encapsulamento acontece quando os dados, atributos, de uma classe são ocultos e seus serviços, métodos, úteis para as demais classes, são públicos [Sommerville 2007]. Ele pode ser identificado via métrica NAP, que define quantos atributos de uma classe são públicos. A identificação do Indecent Exposure em uma classe e em qual faixa se encontra, regular ou ruim, é equivalente à métrica avaliada. 104 VEM Figure 2. Estrutura da UMLsmell. 2.3. Ferramenta A estrutura da ferramenta UMLsmell é mostrada na Figura 2. A ferramenta recebe como entrada um arquivo XMI, no qual é realizada a análise sintática com o objetivo de extrair as seguintes informações: classes, atributos, métodos, parâmetros e relacionamentos. Esses dados são armazenados internamente nas estruturas de dados definidas pelo programa para consultas posteriores, tal que, a partir desses dados é possível fornecer as informações de métricas das classes do software ao usuário. Essas métricas são, então, aplicadas para identificar bad smells conforme o método proposto neste trabalho. A ferramenta foi desenvolvida na linguagem Java e possui 3205 linhas de código. 3. Avaliação Esta seção relata os experimentos realizados para avaliar o método proposto e os seus respectivos resultados. O objetivo desses experimentos foi avaliar o método para identificação de bad smells a partir de diagramas de classes. 3.1. Metodologia Os experimentos investigaram as seguintes questões de pesquisa: RQ1: as métricas de software e seus respectivos valores referência auxiliam a identificar bad smells em um software? RQ2: os bad smells identificados pelo método em um diagrama de classes de um software são correspondentes àqueles identificados por avaliadores com formação em Engenharia de Software? Para responder essas questões foram realizados dois conjuntos de experimentos: • Análise de diagramas de classes de sistemas de software reestruturados: esse experimento avalia a identificação automática de bad smells em duas versões de cada diagrama, tal que uma versão é a refatoração da outra. Tendo em vista que uma refatoração é uma modificação realizada no software para melhorar sua estrutura, 105 VEM espera-se encontrar mais bad smells na versão não refatorada, indicando que o método proposto é eficaz no reconhecimento de bad smells automaticamente. • Avaliação Manual: este experimento avalia manualmente a identificação de bad smells e os compara com os resultados da UMLsmell a fim de avaliar a eficácia da estratégia de detecção proposta. 3.2. Diagramas de Classes dos Experimentos Foram realizados experimentos a partir dos diagramas de classes dos seguintes sistemas de software abertos desenvolvidos em Java: JHotdraw, Struts, HSqlDB, JSLP, Log4J e Sweethome 3D. A seleção desses sistemas de software se deu por eles serem considerados como refatorados, conforme relatado pelos autores Dig et al. [Dig and Johnson 2005] e Soares et al. [Soares et al. 2011]. Isso significa que os desenvolvedores do software, a cada versão lançada, se preocuparam em melhorar a arquitetura desses sistemas de software. Para a escolha dos sistemas de software da avaliação manual, um conjunto de sistemas de software pequenos foram escolhidos no repositório Github e foram analisados por UMLsmell, para determinar quais deles possuiam mais bad smells. Nesse processo foram escolhidos o Picasso e JSLP, pois o fato desses sistemas de software serem pequenos viabilizou a inspeção manual pelos avaliadores. Devido à carência de diagramas de classes para realizar os experimentos, os diagramas dos sistemas de software utilizados para esta avaliação foram obtidos a partir de engenharia reversa usando a ferramenta Enterprise Architect1 para ler os códigos fonte e gerar os diagramas de classes. Como a ferramenta Enterprise Architect não é capaz de criar todos os relacionamentos existentes no código fonte, utilizou-se o software Dependency Finder2 que a partir do bytecode de um software é capaz de gerar um arquivo XML contendo os relacionamentos de dependência para cada classe do software. Para gerar o diagrama de classes completo automaticamente, a partir das informações obtidas na engenharia reversa do Enterprise Architect e do resultado reportado pelo Dependency Finder, neste trabalho foi desenvolvida uma ferramenta para criar automaticamente todos os relacionamentos de dependência existentes no código fonte. Essa ferramenta intermediária foi desenvolvida na linguagem Java e recebe como entrada o arquivo XMI do Enterprise Architect e o arquivo XML do Dependency Finder. A ferramenta realiza uma análise sintática do arquivo XML e os relacionamentos são criados no arquivo XMI da engenharia reversa feita pelo Enterprise Architect. Com isso, obteve-se um arquivo XMI resultante que contém os dados de todas as classes do software e dos relacionamentos existentes entre elas. 4. Resultados Em praticamente todos os sistemas de software foram identificadas ao menos uma melhoria de bad smells de uma versão para outra refatorada. Esse resultado indica a eficácia do método proposto, visto que foram encontrados mais falhas na versão não refatorada dos sistemas de software avaliados. Essas melhorias ficaram evidentes nos sistemas de software Jhotdraw e Sweethome 3D. Nesses dois sistemas de software, a quantidade de bad smells foi muito superior na versão não refatorada do que na versão refatorada, concordando com os estudos de Dig et al. [Dig and Johnson 2005] e Soares et al. 1 2 www.sparxsystems.com.au depfind.sourceforge.net 106 VEM [Soares et al. 2011]. Nesses sistemas de software foram constatados que principalmente nos bad smells Shotgun Surgery e God Class a quantidade de classes que apresentavam esses problemas diminuiu, apontando que a estrutura do sistema realmente passou por melhorias. No entanto, nesses três casos, não se pode dizer o mesmo em relação ao Indecent Exposure, que em alguns casos a quantidade de classes que apresentavam esse bad smell foi mantida ou aumentou da versão não refatorada para versão refatorada. Tal fato pode ter ocorrido porque esse bad smell pode não ter sido alvo de atenções durante as refatorações. Também foram observadas melhorias mais discretas nos sistemas de software Struts, Log4j, HSqlDB e JSLP. Neles, nos três bad smells avaliados, ocorreram menos melhorias da versão não refatorada para a versão refatorada, sendo que em alguns casos ocorreu aumento da quantidade de bad smells. Mas, ainda assim, foi possível detectar que a refatoração ocorreu em alguns casos nos quais os bad smells reduziram, por exemplo, o Indecent Exposure no software Struts. A avaliação manual foi realizada por 15 especialistas com conhecimento em Engenharia de Software que não tinham informações da metodologia utilizada no estudo realizado. Foram entregues dois diagramas de classes aos especialistas e a descrição textual de cada bad smell, afim de que os especialistas identificassem quais classes possuiam quais problemas. O experimento identificou resultados muito próximos dos apresentados pela UMLsmell. Para os bad smells Shotgun Surgery e Indecent Exposure, as classes identificadas como problemáticas pela UMLsmell foram as classes com maior frequência de identificação pelos avaliadores. Das classes em que UMLsmell acusou a presença do bad smell God Class a maioria também foi identificada com esses bad smells pelos avaliadores. Quatro classes identificadas como problemática pelos avaliadores, não foram identificadas como problemáticas pela UMLsmell. Esses resultados indicam que as estratégias de detecção definidas neste estudo, estão próximas dos resultados dos avaliadores. No caso de God Class, houve uma diferença maior entre os resultados do método proposto e a análise manual. Uma explicação possível para isso é que os avaliadores provavelmente consideraram apenas o tamanho das classes, enquanto a estratégia de detecção do método proposto considera também a quantidade de classes que utilizam a classe avaliada, porém tal afirmação só poderia ser comprovada entrevistando os especialistas após o experimento manual. Os resultados dos experimentos realizados em sistemas de software tidos como refatorados mostram que em todos os sistemas de software foram identificadas ao menos uma melhoria de bad smells de uma versão para outra refatorada. Esse resultado indica que o método proposto é capaz de detectar automaticamente os bad smells considerados neste trabalho, visto que foram encontradas mais falhas na versão não refatorada dos sistemas de software avaliados. Com isso, conclui-se que a resposta para RQ1 é positiva. Da mesma forma, os resultados da avaliação manual se mostraram muito próximos daqueles produzidos por UMLsmell, o que indica que a resposta para a RQ2 também é positiva. 5. Trabalhos Relacionados Os trabalhos de Marinescu [Marinescu 2002, Marinescu 2004] são os mais próximos do presente trabalho. Eles apresentam uma solução para transformar métricas em informações relevantes para detectar bad smells e avaliam a proposta a partir de um estudo de 107 VEM caso com um software proprietário de pequeno porte. Bertrán [Bertrán 2009] define estratégias de detecção a serem aplicadas a diagramas de classe, mas evidencia a importância de redefinir os valores referência utilizados em seus estudos experimentais, definidos por Marinescu [Marinescu 2002], pois considera que a técnica utilizada por Marinescu [Marinescu 2002] não seja a melhor forma de definí-los. As principais contribuições do presente trabalho em relação aos trabalhos prévios é que ele: utiliza valores referência definidos e avaliados na literatura para as estratégias de detecção; desenvolveu as ferramentas adequadas para a aplicação do método; avaliou a estratégia proposta com uma quantidade maior de programas, de maior porte e livres, o que faculta a replicação do estudo. 6. Limitações A principal limitação deste trabalho é a pouca quantidade de métricas que têm valores referência definidos na literatura. Isso limita a quantidade de bad-smells que puderam ser avaliados neste trabalho. Outra limitação importante é que o ideal seria a utilização de diagramas de classes para a realização dos estudos de avaliação do método proposto. Todavia, é difícil obter esse tipo de diagrama em projetos abertos e, em geral, há restrições por parte das organizações em fornecer qualquer dado sobre seus sistemas de software proprietários. Devido a isso, os diagramas foram obtidos via engenharia reversa a partir do código fonte de sistemas de software abertos. A utilização de valores referência obtidos a partir de código fonte e não de diagramas de classes também pode influenciar na ocorrência de mais resultados do tipo falso positivo, pois diagramas de classes são mais abstratos que códigos fonte. Apesar dessas limitações, os resultados da avaliação do método proposto indicam que ele é capaz de auxiliar, de forma automática, a identificação de bad smells em software orientado por objetos a partir de diagrama de classes, utilizando, para isso, métricas de software e seus respectivos valores referência. 7. Conclusão Neste trabalho foi proposto um método para permitir identificar desvios de projeto de software nas fases iniciais do ciclo de vida do sistema. O método proposto se baseia em extrair métricas de diagramas de classes e usar os valores referência propostos na literatura para tais métricas para identificar bad smells. Foram identificados os bad smell que podem ser extraídos de diagramas de classes e, então, foram identificadas na literatura as principais métricas que podem ser extraídas de diagramas de classes. Em relação às métricas, duas características foram levadas em consideração: primeiro, as métricas deveriam possuir valores referência propostos na literatura e segundo, as métricas deveriam representar melhor os bad smells que podem ser identificados em diagramas de classes. Os valores referência usados para relacionar as métricas aos bad smells Shotgun Surgery, God Class e Indecent Exposure foram definidos por Ferreira et al. [Ferreira et al. 2012]. Também foi projetada e implementada uma ferramenta, denominada UMLsmell, que permite aplicar o método proposto. A ferramenta identifica automaticamente bad smells em diagramas de classes. Para avaliar o método, foram conduzidos dois estudos. O primeiro foi realizado com o objetivo de verificar se o método proposto identifica os bad smells considerados neste trabalho, a partir da comparação entre versões de sistemas de software que, de 108 VEM acordo com relatos na literatura, passaram por refatorações. O segundo estudo teve por objetivo comparar os resultados reportados pelo método e a avaliação manual. Os resultados dos estudos sugerem que o método proposto auxilia a identificar automaticamente a presença de bad smells em diagramas de classes. Os seguintes trabalhos futuros são identificados a partir dos resultados do presente trabalho: a identificação de valores referência para outras métricas, que será importante para viabilizar a detecção de outros bad smells com o método proposto; avaliar o uso de outras métricas para avaliar os bad smells considerados neste trabalho a fim de refinar as estratégias de detecção sugeridas; estender a ferramenta proposta para viabilizar a identificação de outros bad smells. References Bertrán, I. M. (2009). Avaliação da qualidade de software com base em modelos uml. Dissertação da PUC-RJ. Rio de Janeiro, RJ, Brasil. Pontifícia Universidade Catolica do Rio de Janeiro. Dig, D. and Johnson, R. (2005). The role of refactorings in api evolution. In Software Maintenance, 2005. ICSM’05. Proceedings of the 21st IEEE International Conference on, pages 389–398. IEEE. Ferreira, K. A., Bigonha, M. A., Bigonha, R. S., Mendes, L. F., and Almeida, H. C. (2012). Identifying thresholds for object-oriented software metrics. Journal of Systems and Software, 85(2):244–257. Fowler, M. (1999). Refactoring: improving the design of existing code. Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA. Lanza, M., Marinescu, R., and Ducasse, S. (2006). Object-Oriented Metrics in Practice. Springer-Verlag New York, Inc., Secaucus, NJ, USA. Marinescu, R. (2002). In Measurement and Quality in Object-Oriented Design, Tese de Doutorado. Timisoara, Romênia. University of Timisoara. Marinescu, R. (2004). Detection strategies: metrics-based rules for detecting design flaws. In Software Maintenance, 2004. Proceedings. 20th IEEE International Conference on, pages 350 – 359. Soares, G., Catao, B., Varjao, C., Aguiar, S., Gheyi, R., and Massoni, T. (2011). Analyzing refactorings on software repositories. In Software Engineering (SBES), 2011 25th Brazilian Symposium on, pages 164–173. IEEE. Soliman, T., El-Swesy, A., and Ahmed, S. (2010). Utilizing ck metrics suite to uml models: A case study of microarray midas software. In Informatics and Systems (INFOS), 2010 The 7th International Conference on, pages 1 –6. Sommerville, I. (2007). Engenharia de Software 8a ed. São Paulo: Pearson Addison Wesley. 109 VEM KDM-RE: A Model-Driven Refactoring Tool for KDM Rafael S. Durelli1 , Bruno M. Santos2 , Raphael R. Honda2 , Márcio E. Delamaro1 and Valter V. de Camargo2 1 Computer Systems Department University of São Paulo - ICMC São Carlos, SP, Brazil. 2 Computing Departament Federal University of São Carlos - UFSCAR São Carlos, SP, Brazil. {rdurelli, delamaro}@icmc.usp.br1 , {valter, bruno.santos, raphael.honda}@dc.ufscar.br2 Abstract. Architecture-Driven Modernization (ADM) advocates the use of models as the main artifacts during modernization of legacy systems. Knowledge Discovery Metamodel (KDM) is the main ADM metamodel and its two most outstanding characteristics are the capacity of representing both i) all system details, ranging from lower level to higher level elements, and ii) the dependencies along this spectrum. Although there exist tools, which allow the application of refactorings in class diagrams, none of them uses KDM as their underlying metamodel. As UML is not so complete as KDM in terms of abstraction levels and its main focus is on representing diagrams, it is not the best metamodel for modernizations, since modifications in lower levels cannot be propagated to higher levels. To fulfill this lack, in this paper we present a tool that allows the application of seventeen fine-grained refactorings in class diagrams. The main difference from other tools is that the class diagrams uses KDM as their underlying metamodel and all refactorings are applied on this metamodel. Therefore, the modernizer engineer can detect "model smells" in these diagrams and apply the refactorings. 1. Introduction Architecture-Driven Modernization (ADM) is an initiative which advocates for the application of Model Driven Architecture (MDA) principles to formalize the software reengineering process. According to the OMG the most important artifact provided by ADM is the Knowledge Discovery Metamodel (KDM). KDM is an OMG specification adopted as ISO/IEC 19506 by the International Standards Organization for representing information related to existing software systems. KDM is structured in a hierarchy of four layers; Infrastructure Layer, Program Elements Layer, Runtime Resource Layer, and Abstractions Layer. We are specially interested in the Program Elements Layer because it defines the Code and Action packages which are widely used by our tool. The Code package defines a set of meta-classes that represents the common elements in the source-code supported by different programming languages such as: (i) ClassUnit and InterfaceUnit which represent classes and interface, respectively, (ii) StorableUnit which illustrates attributes and (iii) MethodUnit to represent methods, etc. The Action package represents behavior descriptions and control-and-data-flow relationships between code 110 VEM elements. Refactoring has been known and highly used both industrially and academically. It is a form of transformation that was initially defined by Opdyke [Opdyke 1992] as “a change made to the internal structure of the software while preserving its external behavior at the same level of abstraction”. In the area of object-oriented programming, refactorings are the technique of choice for improving the structure of existing code without changing its external behavior [Fowler et al. 2000]. Refactorings have been proved to be useful to improve the quality attributes of source code, and thus, to increase its maintainability. It is possible to identify several catalogs of refactoring for different languages and the most complete and influential was published by Fowler in [Fowler et al. 2000]. Nowadays, there are researches been carried out about apply refactoring in model instead of source code[Ulrich and Newcomb 2010]. Nevertheless, although ADM provides the process for refactoring legacy systems by means of KDM, there is a lack of an Integrated Development Environment (IDE) to lead engineers to apply refactorings as such exist in others object-oriented languages. In the same direction, Model-Driven Modernization (MDM) is a special kind of model transformation that allows us to improve the structure of the model while preserving its internal quality characteristics. MDM is a considerably new area of research which still needs to reach the level of maturity attained by source code refactoring [Misbhauddin and Alshayeb 2012]. In order to enable MDM in the context of ADM, refactorings for the KDM metamodel are required. In this context, in a parallel research line of the same group, we developed a catalogue of refactorings for the KDM [Durelli et al. 2014]. We argue that devising a refactoring catalogue for KDM makes this catalogue language-independent and standardized. However, the KDM metamodel was not created with the goal of being the basis for diagrams, as is the case of UML metamodel. Thereby, in order to make possible to apply fine-grained refactoring in the KDM metamodel, it is necessary to devise a way to view the KDM instance graphically. Furthermore, although there exist tools, which allow the application of refactorings in class diagrams, none of them uses KDM as their underlying metamodel. As UML is not so complete as KDM in terms of abstraction levels and its main focus is on representing diagrams, it is not the best metamodel for modernizations, since modifications in lower levels cannot be propagated to higher levels Hence, the main contribution of this paper is the provision of a plug-in on the top of the Eclipse Platform named Knowledge Discovery Model-Refactoring Environment (KDM-RE). This plug-in can be used to lead engineers to apply refactorings in KDM, which are based on seventeen well known refactorings[Fowler et al. 2000]. The IDE as well as the adapted catalogue are based on our experience as model-driven engineering. Also, by using this plug-in the modernizer engineer can visualize the Code package as an UML class diagram, allowing engineers to detect model smells in that diagram. One hypothetical case study was developed in order to exemplify the use of the plug-in. This paper is organized as followed: Section 2 provides the background to fully understand our plug-in - Section 3 depicts information upon the plug-in KDM-RE and an case study - in Section 4 there are related works and in Section 5 we conclude the paper with some remarks and future directions. 2. ADM and KDM OMG defined ADM initiative [Perez-Castillo et al. 2009] which advocates carrying out the reengineering process considering MDA principles. ADM is the concept of modern111 VEM Abstraction Layer Conceptual Data Code Resource Layer UI Core, KDM, source Action Platform Program Elements Layer Event Build Infrastructure Layer Structure Figure 1. Layers, packages, and separation of concerns in KDM (Adapted from [OMG 2012]) izing existing systems with a focus on all aspects of the current systems architecture. It also provides the ability to transform current architectures to target architectures by using all principles of MDA [Ulrich and Newcomb 2010]. To perform a system modernization, ADM introduces Knowledge Discovery meta-model (KDM). KDM is an OMG specification adopted as ISO/IEC 19506 by the International Standards Organization for representing information related to existing software systems. According to [Perez-Castillo et al. 2009] the goal of the KDM is to define a meta-model to represent all the different legacy software artifacts involved in a legacy information system (e.g. source code, user interfaces, databases, etc.). The KDM provides a comprehensive high-level view of the behavior, structure and data of legacy information systems by means of a set of meta-models. The main purpose of the KDM specification is not the representation of models related strictly to the source code nature such as Unified Modeling Language (UML). While UML can be used to mainly to visualize the system “as-is”, an ADM-based process using KDM starts from the different legacy software artifacts and builds higher-abstraction level models in a bottom-up manner through reverse engineering techniques. As outlined before, the KDM consists of four abstraction layers: (i) Infrastructure Layer, (ii) Program Elements Layer, (iii) Runtime Resource Layer, and (iv) Abstractions Layer. Each layer is further organized into packages, as can be seen in Figure 1. Each package defines a set of meta-model elements whose purpose is to represent a certain independent facet of knowledge related to existing software systems. We are specially interested in the Program Elements Layer because it defines the Code and Action packages which are widely used by our catalogue. The Code package defines a set of meta-classes that represents the common elements in the source code supported by different programming languages. In Table 1 is depicted some of them. This table identifies KDM meta-classes possessing similar characteristics to the static structure of the source code. Some meta-classes can be direct mapped, such as Class from object-oriented language, which can be easily mapped to the ClassUnit meta-class from KDM. 3. Refactoring for KDM by means of KDM-RE This sections describes KDM-RE. In Figure 2 we depicted the main window of our pluga and . b It supports 17 in. For explanation purpose, we highlight two main regions, i.e., , 112 VEM Table 1. Meta-classes for Modeling the Static Structure of the Source-code Source'Code*Element* Class* Interface* Method* Field* Local*Variable* Parameter* Association* KDM*Meta'Classes* ClassUnit* InterfaceUnit* MethodUnit* StorableUnit* Member* ParameterUnit* KdmRelationShip* refactorings adapted to KDM. These refactorings are based on some fine-grained refactorings proposed by Fowler [Fowler et al. 2000]. All the refactorings are shown in Table 2. We chose the Fowler’s refactorings because they are well known, basic and fine-grained refactorings. Please, not that KDM-RE uses MoDisco1 once it provides an extensible framework to transform an specific source-code to KDM models. In Figure 2 is presented Table 2. Refactorings Adapted to KDM Rename Feature Rename ClassUnit Rename StorableUnit Moving Features Between Objects Move MethodUnit Move StorableUnit Extract ClassUnit Rename MethodUnit Inline ClassUnit Organing Data Replace data value with Object Encapsulate StorableUnit Replace Type Code with ClassUnit Replace Type Code with SubClass Replace Type Code with State/Strategy Dealing with Generalization Push Down MethodUnit Push Down StorableUnit Pull Up StorableUnit Pull Up MethodUnit Extract SubClass Extract SuperClass Collapse Hierarchy ! Figure 2. Snippets KDM-RE’s Interface just a snippet of KDM-RE. Starting from the popup menu named “Refactoring KDM”, in a either the software developer or software modernizer this model browser, see Figure 2, can interact with the KDM model and choose which refactoring must be carried out in a can be seen all 17 refactorings that have been implemented in the KDM. In the region KDM-RE. For illustration purposes only we drew rectangles to separate the refactorings 1 http://www.eclipse.org/MoDisco/ 113 VEM into three groups. The black rectangle represents refactorings that deal with generalization, the blue rectangle stand for refactorings to organize data and the red one symbolize refactoring to assist the moving features between objects. b on Figure 2 shows an UML class diagram. This diagram can be The region used before to apply some refactorings to assist the modernizer to decide where/when to apply the refactorings. This UML class diagram also can be useful as the modernizer performs the refactorings in KDM model. For instance, changes are reproduced on the fly in a class diagram. We claim that the latter use of this diagram is important once it provides an abstract view of the system, hence, the modernizer can visually check the system’s changes after applying a set of refactorings. Furthermore, in the context of modernization usually the source-code is the only available artifact of a legacy system. Therefore, creating an UML class diagram makes, both the legacy system and the generated software to have a new type of artifact (i.e., UML class models), improving their documentation. 3.1. Case Study In this section, we motivate KDM-RE by analyzing one hypothetical case study. This b (left side) shows a class case study is a small part of the university domain. Figure 2 diagram used for modeling a small part of the university domain. In an university there are several Persons, more specifically Professors, their Assistants, and Students. Each Person has RG, CPF, and address (of type String). Moreover, classes Professor, Assistant, and Student have an attribute name of type String each. The software modernizer or the b left software developer found out by looking at the UML class diagram (see Figure 2 side) this redundantly, i.e., equal attributes in sibling classes. Therefore, he/she must apply the refactoring “Pull Up Field’. Similarly, he/she also found out by looking at the UML class diagram that one class is doing work that should be done by two or more. For example, he/she found that the attributes RG and CPF should be modularized to a class. Similarly, it is necessary to provide more information about they address, such as number, city, country, etc. Therefore, he/she must apply the refactoring “Extract Class” to the attributes “RG”, “CPF” and “rua”. Due space limitation it is depicted just the extraction of the attributes “RG” and “CPF”. The first step is to select the meta-class that he/she identified as a bad smell, i.e., the meta-class to be extracted into a separate one. This step is illustrated in Figure 3(a). After selecting the meta-class, a right-click opens the context menu where the refactoring is accessible. After the click, the system displays the “RefactoringWizard” to the engineer, Figure 3(b) depicts the Extract Class Wizard. In this wizard, the name of the new meta-class can be set. Also a preview of all detected StorableUnits and MethodUnits that can be chosen to put into the new meta-class. Further, the engineer can select if either the new meta-class will be a top level meta-class or a nested meta-class. The engineer also can select if the KDM-RE must create instances of MethodUnits to represent accessors methods (gets and sets). Finally, the engineer can set the name of the StorableUnit that represent the link between the two meta-classes (the old meta-class and the new one). After all of the required inputs have been made, the engineer can click on the button “Finish” and the refactoring “Extract Class” is performed by KDM-RE. As can be seen in Figure 3(c) a new instance of ClassUnit named “Document” was created - two StorableUnit from “Pessoa”, i.e., “rg” and “CPF” were moved 114 VEM (b) (a) (c) Figure 3. Extract Class Wizard to the new ClassUnit - instances of MethodUnits were also created to represent the gets and sets. In addition, the instance of ClassUnit named “Pessoa” owns a new instance of StorableUnit that represent the link between both ClassUnits. Due space limitation the other StorableUnits of ClassUnit named “Pessoa” are not shown in Figure 3(c). After the engineer realize the refactorings, an UML class diagram is created on the fly to mirror graphically all changes performed in the KDM model, see b right side. Figure 2 4. Related Work Van Gorp et al. [Gorp et al. 2003] proposed a UML profile to express pre and post conditions of source code refactorings using Object Constraint Language (OCL) constraints. The proposed profile allows that a CASE tool: (i) verify pre and post conditions for the composition of sequences of refactorings; and (ii) use the OCL consulting mechanism to detect bad smells such as crosscutting concerns. Reimann et al. [Reimann et al. 2010] present an approach for EMF model refactoring. They propose the definition of EMFbased refactoring in a generic way. Another approach for EMF model refactoring is presented in [Thorsten Arendt 2013]. They propose EMF Refactor 2 , which is a new Eclipse incubation project in the Eclipse Modeling Project consisting of three main components. Besides a code generation module and a refactoring application module, it comes along with a suite of predefined EMF model refactorings for UML and Ecore models. 2 http://www.eclipse.org/emf-refactor/ 115 VEM 5. Concluding Remarks In this paper is presented the KDM-RE which is a plug-in on the top of the Eclipse Platform to provide support to model-driven refactoring based on ADM and uses the KDM standard. More specifically, this plug-in supports 17 refactorings adapted to KDM. These refactorings are based on some fine-grained refactorings proposed by Fowler [Fowler et al. 2000]. As stated in the case study the engineer/modernizer by using KDM-RE can apply a set refactorings in a KDM. Also, on the fly the engineer can check all changes realized in this KDM replicated into a class diagram - the engineer can visually verify the system’s changes after applying a set of refactorings. In addition, usually the source code is the only available artifact of the legacy software. Therefore, creating an UML class diagram makes, both the legacy software and the generated software to have a new type of artifact (i.e., UML class models), improving their documentation. Also, we claim that as we have defined all refactoring based on the KDM, they can be easily reused by others researchers. It is important to notice that the application of refactorings in UML class diagrams is not a new research as stated before. However, all of the works we found on literature perform the refactoring directly on the UML metamodel. Although UML is also an ISO standard, its primary intention is just to represent diagrams and not all the characteristics of a system. As KDM has been created to represent all artifacts and all characteristics of a system, refactorings performed on its finer-grained elements can be propagated to higher level elements. This propitiates a more complete and manageable model-driven modernization process because all information is concentrated in just one metamodel. In terms of the the users who uses modernization tools like ours, the difference is not noticeable; that is, whether the refactorings are performed over UML or KDM. However, there are two main benefits of developing a refactoring catalogue for KDM. The first one is in terms of reusability. Other modernizer engineers can take advantage of our catalogue to conduct modernizations in their systems. The second benefit is that, unlikely UML, a catalogue for KDM can be extended to higher abstractions levels, such as architecture and conceptual, propitiating a good traceability among these layers. We believe that KDM-RE makes a contribution to the challenges of Software Engineering which focuses on mechanisms to support the automation of model-driven refactoring. Future work involves implementing more refactorings and conducting experiments to evaluate all refactorings provided by KDM-RE. Doing so, we hope to address a broader audience with respect to using, maintaining, and evaluating our tools. Currently, KDM-RE generates only class diagrams to assist the modernization engineer to perform refactorings, however, as future work, we intend to: (i) extend this computational support to enable the achievement of other diagrams, e.g., the sequence diagram, (ii) perform structural check of the software after the application of refactorings; and (iii) carry out the assessment tool, as well as refactorings proposed by controlled experiments. A work that is already underway is to check how other parts of the highest level of KDM are affected after the application of certain refactorings. For example, assume that there are two packages P1 and P2. Suppose there is a class in P1, named C1, and within the P2 there is a class named C2. Assume that C1 owns an attribute A1 of the type C2., i.e., there is an association relationship between these classes of different packages. P1 and P2 represent architectural layers, i.e., P1 = Model and P2 = View. Thus, the relationship that exists is undesirable. When we make a fine-grained refactoring such as moving the attribute A1 116 VEM of the class C1, it should be reflected to the architectural level, eliminating the existing relationship between the two architectural layers. 6. Acknowledgements Rafael S. Durelli would like to thank the financial support provided by FAPESP, process number 2012/05168-4. Bruno Santos and Raphael Honda also would like to thank CNPq for sponsoring our research. References Durelli, R. S., Santibáñez, D. S. M., Delamaro, M. E., and Camargo, V. V. (2014). Towards a refactoring catalogue for knowledge discovery metamodel. In IEEE 15th International Conference on Information Reuse and Integration (IRI). Fowler, M., Beck, K., Brant, J., Opdyke, W., and Roberts, D. (2000). Refactoring: Improving the Design of Existing Code. Addison-Wesley. Gorp, P. V., Stenten, H., Mens, T., and Demeyer, S. (2003). Towards automating sourceconsistent uml refactorings. In International Conference on UML - The Unified Modeling Language, pages 144–158. Springer. Misbhauddin, M. and Alshayeb, M. (2012). Model-driven refactoring approaches: A comparison criteria. In Sofware Engineering and Applied Computing (ACSEAC), 2012 African Conference on. OMG (2012). Object Management Group (OMG) Architecture-Driven Modernisation. Disponível em: http://www.omgwiki.org/admtf/doku.php?id=start. (Acessado 2 de Agosto de 2012). Opdyke, W. F. (1992). Refactoring Object-Oriented Frameworks. Ph.D. Thesis, University of Illinois. Perez-Castillo, R., de Guzman, I. G.-R., Avila-Garcia, O., and Piattini, M. (2009). On the use of adm to contextualize data on legacy source code for software modernization. In Proceedings of the 2009 16th Working Conference on Reverse Engineering, WCRE ’09, pages 128–132, Washington, DC, USA. IEEE Computer Society. Reimann, J., Seifert, M., and Abmann, U. (2010). Role-based generic model refactoring. In In ACM/IEEE 13th International Conference on Model Driven Engineering Languages and Systems (MoDELS 2013). Springer. Thorsten Arendt, Timo Kehrer, G. T. (2013). Understanding complex changes and improving the quality of uml and domain-specific models. In In ACM/IEEE 16th International Conference on Model Driven Engineering Languages and Systems (MoDELS 2013). Ulrich, W. M. and Newcomb, P. (2010). Information Systems Transformation: Architecture-Driven Modernization Case Studies. Morgan Kaufmann Publishers Inc., San Francisco, CA, USA. 117 VEM Uma Análise da História do VEM, WBVS e WMSWM Renato Novais, Thiago S. Mendes, Fernando Teles Instituto Federal da Bahia (IFBA) – Salvador – Bahia – Brasil {renato,thiagosouto,fernandoteles}@ifba.edu.br Abstract. The historical analysis of the publications of workshops on Software Visualization, Maintenance, and Evolution is of great importance to understand the evolution of the works that have been published and to have an overview of the research being conducted in these areas. This work presents an analysis and classification of publications in the past editions of the event VEM, WBVS and WMSWM. The method used was a process based on a systematic mapping of the publications in the proceedings of the three events from 2004 to 2013. We analyzed 88 papers from WMSWM, 13 from WBVS, and 7 from VEM. We recorded the history of events in BDBComp, as well as conducted an analysis of the h-index using Google Scholar. In addition, we quantitative classified the papers to have an understanding of the evolution of these events, which may contribute to the decision-making for future research. Resumo. A análise histórica das publicações dos workshops de Manutenção, Evolução e Visualização de Software é de grande relevância para compreender a evolução dos trabalhos que já foram apresentados e para ter um panorama das pesquisas que estão sendo realizadas nessas áreas. Este trabalho apresenta uma análise das publicações ocorridas nas últimas edições dos eventos VEM, WBVS e WMSWM. O método utilizado foi um processo baseado em um mapeamento sistemático das publicações nos anais dos três eventos de 2004 até 2013. Foram analisados 88 artigos do WMSWM, 13 do WBVS, e 7 do VEM. Foi realizado o registro da história dos eventos na BDBComp, assim como uma análise do h-index a partir do Google Scholar. Além disso, foi feita uma classificação dos trabalhos para ter um entendimento da evolução destes eventos, o que pode contribuir para as tomadas de decisões de pesquisas futuras. 1. Introdução O Workshop de Visualização, Evolução e Manutenção de Software (VEM) está, neste ano de 2014, em sua II edição. Porém, apesar do pouco tempo, este workshop vem sendo construído a partir da junção de dois outros workshops, a saber: Workshop de Manutenção de Software Moderna (WMSWM), com 10 edições, e Workshop Brasileiro de Visualização de Software (WBVS), com duas edições. Esta junção aconteceu a partir de uma ação das comunidades científicas envolvidas com os dois workshops citados, no sentido de fortalecer tal evento. Isto é justificado uma vez que as áreas de atuação do VEM tem uma grande interseção. Isto pode ser evidenciado, por exemplo, no artigo [Novais et. al 2013], que mostra que os principais eventos onde os artigos de visualização de software são publicados têm uma ligação relevante com manutenção e evolução de software. 118 VEM Neste ano, há um esforço específico para fortalecimento do evento, através do registro da história dos eventos correlatos na Biblioteca Digital Brasileira de Computação1 (BDBComp), bem como na busca do registro de um possível Qualis CAPES2 para o evento, através da análise do h-index a partir do Google Scholar3. O objetivo do artigo é mostrar o trabalho realizado para cadastro dos artigos na biblioteca BDBComp, apresentar dados quantitativos dos eventos passados e incentivar a participação de novos pesquisadores no evento. O artigo apresenta uma análise histórica desses três eventos. Para essa análise histórica, foram considerados 88 artigos do WMSWM, 13 do WBVS, e 7 do VEM, em suas edições passadas. A taxonomia utilizada para classificar os artigos é apresentada na Seção 4. A taxonomia envolve essencialmente a análise dos metadados do artigo. Com essa classificação, é possível ter um panorama da evolução deste evento, o que pode contribuir para tomada de decisões futuras. Essa ação permitiu também uma análise dos dados do h-index, feito através das referências do próprio evento. Os dados produzidos neste trabalho estão disponíveis no website do estudo4. Além desta introdução, este artigo está organizado como se segue. A Seção 2 descreve o esforço inicial para a obtenção do Qualis do evento. A Seção 3 descreve o planejamento do estudo, destacando o protocolo utilizado para classificar os artigos. A Seção 4 mostra os resultados coletados a partir da análise dos artigos. Por fim, a Seção 5 conclui o artigo. 2. Esforço inicial para obtenção do Qualis do VEM Como primeiro esforço para fortalecer o VEM, foi decidido abrir uma frente de trabalho para buscar o registro do Qualis CAPES para este evento. Inicialmente, cadastramos todos os artigos dos três eventos na BDBComp (WMSWM5, WBVS6 e VEM7). Foram cadastrados 108 artigos referentes aos três eventos. Além do grande esforço manual associado à realização do cadastro, outro grande desafio dessa atividade foi conseguir os artigos de todas as edições dos eventos. A dificuldade esteve relacionada principalmente aos primeiros anos do WMSWM. Muitos dos sites dos eventos estavam fora do ar e os artigos não estavam disponíveis na Internet. Para obter grande parte dos artigos, foi necessário contactar as pessoas envolvidas com a realização desses eventos ao longo do tempo. A edição do ano 2005 teve uma dificuldade extra para cadastro na BDBComp, uma vez que os artigos foram salvos no formato “.pdf” como imagens. Posteriormente, foi feita uma investigação da quantidade de citações de cada artigo através do Google Scholar. Isto permitiu a identificação do h-index do VEM (considerando a história dos outros eventos). No momento da escrita deste artigo, havia: 1 artigo com 6 citações; 1 com 5 citações; 1 com 4 citações; 8 com 3 citações; 9 com 1 Biblioteca Digital Brasileira - http://www.lbd.dcc.ufmg.br/bdbcomp/ Sistema WebQualis - http://qualis.capes.gov.br/ 3 Google Scholar - http://scholar.google.com 4 Website do estudo - http://www.wiki.ifba.edu.br/vem2014 5 WMSWM - http://www.lbd.dcc.ufmg.br/bdbcomp/servlet/PesquisaEvento?evento=wmswm 6 WBVS - http://www.lbd.dcc.ufmg.br/bdbcomp/servlet/PesquisaEvento?evento=WBVS 7 VEM - http://www.lbd.dcc.ufmg.br/bdbcomp/servlet/Evento?id=691 2 119 VEM duas citações; 13 com 1 citação; 75 com nenhuma citação. Isto implica em um h-index igual a 3. Consequentemente, o workshop deveria ter um Qualis B5. 3. Planejamento do estudo Apesar deste estudo não seguir o rigor metodológico de uma revisão ou mapeamento sistemático, ele foi realizado seguindo algumas das boas práticas do protocolo proposto por Kitchenham e Charters (2007). A seguir são mostrados os itens importantes para o planejamento do mesmo. 1) Questão de Pesquisa: Como ocorreu a evolução histórica dos artigos publicados nos eventos WMSWM, WBVS e VEM? 2) Critérios de Inclusão/Exclusão: foram incluídos todos (e apenas) os artigos de todas as edições dos três eventos: WMSWM (2004-2013), WBVS (2011/2012) e VEM (2013). 3) Esquema de Classificação: no intuito de entender como se deu a publicação dos artigos nestes eventos, foram realizados dois tipos de classificações, que culminaram no conjunto de facetas utilizadas no estudo, a saber: i) baseada nos metadados, o que inclui autor, instituição, ano e idioma; e iii) foi feito uma análise das referências de cada artigo, no sentido de identificar quais artigos referenciam artigos dos próprios eventos sendo analisados. 4) Extração de dados: para esta atividade foi utilizado um formulário de extração de dados projetado para reunir a informação desejada com as facetas descritas acima. Pelo menos dois pesquisadores classificaram cada artigo. Quando não houve um acordo sobre alguma classificação, ou na coleta da informação, um terceiro pesquisador analisou as diferenças e decidiu as questões para chegar em um consenso. 4. Resultados Esta seção apresenta os principais resultados das atividades de extração de dados. Cada subseção a seguir foca nas facetas levantadas para este estudo. 4.1. Quantidade de artigos aceitos ao longo dos anos A Figura 1 apresenta a distribuição de artigos por ano e por evento. Em 2009, o WMSWM teve seu número máximo de artigos aceitos em uma única edição do evento: 13. Durante três anos (2011, 2012, 2013) houve a coexistência do WMSWM com um dos outros dois eventos. A soma dos artigos dos dois eventos conjuntos também deu um total de 13 artigos. 120 VEM Figura 1. Número de artigos por ano. 4.2. Idioma dos Artigos A Figura 2 destaca o número de artigos por ano e por idioma (português - pt, inglês - en). Os anos de maior destaque foram 2004 e 2012 para o WMSWM, e 2011 para o WBVS, todos com 4 artigos em português e 3 em inglês. É possível observar que a quantidade de artigos escritos em inglês ainda é muito baixa. É necessário a realização de ações para incentivar os pesquisadores da comunidade do VEM a escreverem os trabalhos na língua inglesa. Da mesma forma, é importante também convidar pesquisadores de outros países para que submetam seus trabalhos para o VEM, com o objetivo de divulgar e fortalecer o evento em outras regiões do mundo. Figura 2. Número de artigos por idioma e por ano. 4.3. Regiões de origem dos autores dos artigos A Figura 3 apresenta os artigos por região de origem dos autores. Houve 15 estados brasileiros e 3 países estrangeiros. Note, por exemplo, os quatro estados com maior destaque (SP, RJ, MG, BA) com mais de 20 artigos publicados cada. O artigo dos EUA, foi de um autor com afiliação à IBM Almaden Research Center [Cortés et. al 2007]. Esse artigo foi em conjunto com autores do Ceará e Rio de Janeiro. O artigo [Maña et. al 2009] foi o mais essencialmente estrangeiro, com um autor com afiliação à University of Malaga, na Espanha, e um com afiliação à City University of London, na Inglaterra. 121 VEM Figura 3. Número de artigos por região. 4.4. Principais instituições Foi feito um levantamento das instituições de afiliações dos autores dos artigos. Há 63 instituições diferentes. A Figura 4 apresenta o número de artigos por instituição (com pelo menos dois artigos). A COPPE/UFRJ aparece na liderança com 18 artigos publicados, seguido imediatamente por USP, com 15 artigos, e UFSCar, com 11 artigos. Figura 4. Número de artigos por instituição (# artigos >= 2). 4.5. Principais Autores Outro levantamento realizado neste estudo foi relacionado aos autores dos artigos. 240 autores diferentes publicaram nesses anos, considerando os três eventos. Para fazer esse levantamento foi necessário realizar uma limpeza dos dados uma vez que muitos autores usaram grafias diferentes de seus nomes (e.g. Rosângela Penteado apareceu como Rosângela A. D. Penteado, Rosangela Ap. D. Penteado, Rosângela Aparecida Dellosso Penteado, Rosângela Dellosso Penteado, e Rosângela Penteado). A Figura 5 apresenta os 15 autores com maior número de artigos publicados nos eventos. Destaca-se Cláudia Werner com 14 artigos, seguida por Rosângela Penteado com 10 e Manoel Mendonça com 9. Vale destacar também a presença de Marcelo Schots nessa lista, o único não doutor até o momento da escrita deste artigo. 122 VEM Figura 5. Os 15 autores com maior número de artigos nos eventos. 4.6. Nuvem de palavras dos artigos do VEM Foi criada uma nuvem de palavras a partir dos textos dos artigos para verificar as palavras com maior destaque nos trabalhos que já foram apresentados. Para isso, foi utilizada uma extração automática dos textos do formato “.pdf”, convertendo-os para um único arquivo o formato “.txt”. Entretanto, houve uma dificuldade de extração dos textos do WMSWM do ano de 2005, cujos arquivos encontravam-se no formato “.pdf” como imagens. Por este motivo, foi realizado um esforço manual de extração dos resumos/abstracts dos artigos a partir do BDBComp. Depois, foram removidas as stopwords, em português e inglês. Foi utilizada a ferramenta Wordle8 para gerar a nuvem de palavras. O resultado é mostrado na Figura 6. Figura 6. Nuvem de palavras gerada a partir dos abstracts dos artigos. Esta nuvem pode servir como ponto de partida para se criar uma taxonomia de classificação dos artigos. Poderia, posteriormente, se realizar uma classificação dos artigos e discussão de acordo com os assuntos que são abordadas nos mesmos (ex., técnicas, ferramentas, estudos de caso, visualização, evolução, etc.) indicando numericamente quantos artigos tratam de cada assunto. 8 Wordle - http://www.wordle.net/create 123 VEM 4.7. Uma análise das referências dos eventos Uma das principais motivações deste estudo foi à geração do h-index para o evento. Para isso, foi necessário fazer um levantamento das referências de cada artigo. A Seção 2 discute essa ação através do uso do Google Scholar. Aqui nesta seção, é feita uma análise de como cada artigo referencia outro artigo dentro do próprio evento. A Figura 7 mostra, para cada ano, a quantidade de referências para artigos do próprio evento. É possível observar a baixa citação feita nesses anos. O ano com maior número é o de 2007, com 5 referências, sendo 3 feitas pelo mesmo artigo [de Souza et. al 2007]. Esses dados traz à tona um dos pontos mais críticos desse evento. Para uma obtenção de um bom h-index, e consequente um bom Qualis, é importante a referência para artigos do evento. Entretanto, isso não está acontecendo como deveria nem pelos artigos publicados nos próprios eventos em questão. Figura 7. Referências para o próprio evento. Esse conjunto de referências foi feito a partir de 13 artigos diferentes. Dos quais, apenas 4 deles fazem referências para artigos de outros autores que não do próprio artigo. Tem-se um total de 19 referências para artigos do próprio evento, sendo apenas 7 para outros autores. Ou seja, são 12 referências para artigos dos próprios autores. O evento/ano com maior número de referências foi o WMSWM 2004, onde: o artigo [Souza 2004] teve 3 referências, o [Dias 2004] com 2, [Silva 2004] e [Vasconcelos 2004] tiveram 1 cada. Considerando apenas as citações dentro do próprio evento, há 2 artigos com 2 referências cada. Da mesma forma, tem-se também um h-index igual a 2, e Qualis B5. 5. Conclusão O Workshop de Visualização, Evolução e Manutenção de Software (VEM) tem como objetivo integrar as comunidades das áreas de Visualização, Manutenção e Evolução de Software. Este evento vem sendo construído a partir de dois outros workshops: WMSWM e WBVS. Neste ano de 2014, esforços continuam sendo empregados no sentido de fortalecer o evento. Houve, por exemplo, o registro da história dos eventos na BDBComp, assim como uma análise do h-index a partir do Google Scholar, para tentar o registro de um possível Qualis CAPES para o evento. Este artigo reportou esses esforços realizados. Além disso, apresentou uma análise da história dos três eventos em questão, a partir de uma classificação de um total 124 VEM de 108 artigos. Foi possível observar como se deu as publicações ao longo dos anos, o que pode ser levado em consideração para projetar as ações de fortalecimento para os próximos anos do evento, como por exemplo, melhorar o processo de divulgação do evento e incentivar a participação de novos pesquisadores. Como trabalhos futuros pretende-se: realizar uma análise qualitativa dos artigos e criar estratégias para aumentar a formação de parcerias entre pesquisadores e grupos de pesquisa da área. Referências Cortés, M.; Fontoura, M.; Lucena; C. (2007), “Integrated Approach for FrameworkBased System Redesign”, In: IV Workshop de Manutenção de Software Moderna (WMSWM), Porto de Galinhas – PE. de Souza, K. M.; Scalet, D.; Belchior, A. (2007), “Documentação Essencial para Manutenção de Software II”, In: IV Workshop de Manutenção de Software Moderna (WMSWM), Porto de Galinhas, PE. Dias, M. (2004), “Uma experiência no ensino de manutenção de software”, In: I Workshop de Manutenção de Software Moderna (WMSWM), Brasília, DF. Ghezzi, C. (2009), “Reflections on 40+ years of software engineering research and beyond an insiders view”, In: 31st International Conference on Software Engineering, (ICSE), pp. 1-58. Gomes, J.; da Mota Silveira Neto, P. A.; Cruzes, D.; Santana de Almeida, E. (2011), “25 Years of Software Engineering in Brazil: An Analysis of SBES History”, in: Software Engineering (SBES) 25th Brazilian Symposium on, pp. 4-13. Kitchenham, B.; Charters, S. (2007), “Guidelines for performing Systematic Literature Reviews in Software Engineering (EBSE 2007-2001)”, Technical report, Keele University and Durham University Joint Report. Maña, A.; Spanoudakis, G.; Harjani, R.; Ruiz, J. F. (2009), “An Infrastructure for Maintenance and Evolution of Security and Dependability in Dynamic Computing Scenarios”, In: VI Workshop de Manutenção de Software Moderna (WMSWM), Ouro Preto, MG. Novais, R. L.; Torres, A.; Mendes, T. S.; Mendonça, M.; Zazworka, N. (2013), “Software evolution visualization: A systematic mapping study”, Information and Software Technology 55(11), 1860 - 1883. Silva, M.; Braga, R.; Masiero, P. (2004), “Evolução Orientada a Aspectos de um Framework OO”, In: I Workshop de Manutenção de Software Moderna (WMSWM), Brasília, DF. Souza, S.; Neves, W.; Anquetil, N.; Oliveira, K. (2004), “Documentação Essencial para Manutenção de Software II”, In: I Workshop de Manutenção de Software Moderna (WMSWM), Brasília, DF. Vasconcelos, A.; Werner, C. (2004), “Software Architecture Recovery based on Dynamic Analysis”, In: I Workshop de Manutenção de Software Moderna (WMSWM), Brasília, DF. 125