II Workshop de Teses e Dissertações em Sistemas de Informação, Goiânia - GO, 27 de Maio de 2015. Sincronização Automática dos Artefatos de Processos de Negócio: Métodos e Aplicações Automatic Synchronization of BPM Description Artifacts: Methods and Applications Raphael de A. Rodrigues Programa de Pós-Graduação em Informática (PPGI/UNIRIO) Av. Pasteur, 456, Urca, Rio de Janeiro, RJ, Brasil Leonardo G. Azevedo Programa de Pós-Graduação em Informática (PPGI/UNIRIO) Av. Pasteur, 456, Urca, Rio de Janeiro, RJ, Brasil IBM Research raphael.rodrigues@uniriotec Av. Pasteur, 136, Botafogo, Rio de Janeiro, RJ, Brasil Kate Revoredo Programa de Pós-Graduação em Informática (PPGI/UNIRIO) Av. Pasteur, 456, Urca, Rio de Janeiro, RJ, Brasil [email protected] [email protected], [email protected] RESUMO A validação de modelos de processos de negócio é executada por analistas de sistemas. Estes podem ler facilmente o modelo, porém não detêm conhecimento aprofundado do negócio. Em contrapartida, especialistas de domı́nio conhecem o negócio, porém não detêm conhecimento sobre modelagem. Para estes, é mais fácil ler um texto em linguagem natural. Por este motivo, tanto o modelo de processo quanto o texto descritivo são artefatos necessários para permitir uma boa comunicação entre especialistas e analistas. Este trabalho propõe uma metodologia para geração de textos a partir de modelos e vice-versa. A metodologia será avaliada em cenários reais, através de empresas e estudos de caso. The manual management of both resources may result in inconsistencies, due to unilateral modifications. This research propose a methodology for text generation from process models and vice-versa. The methodology will be evaluated in real scenarios, through companies and case study. Categories and Subject Descriptors H.4 [Information Systems Applications]: Miscellaneous; I.2.7 [Computing Methodologies]: ARTIFICIAL INTELLIGENCE Natural Language Processing [Language generation, Machine translation] General Terms Palavras-Chave Design, Documentation, Languages Geração de Linguagem Natural, modelos de processo, texto em linguagem natural, BPMN Keywords Natural language generation, process models, natural language text, BPMN ABSTRACT System analysts are responsible for the validation of Business Process Models. They can easily read the model but do not have the necessary knowledge about the business. On the other hand, domain specialists know the business, but do not have the necessary modeling skills. It is easier for them to read a natural language text. For this reason, both model and text are necessary artifacts for a good communication between business specialits and system analysts. Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. SBSI 2015, May 26th-29th, 2015, Goiânia, Goiás, Brazil Copyright SBC 2015. 31 1. INTRODUÇÃO Diversas organizações utilizam notações para descrever seus processos de negócio, como a BPMN [2]. A notação BPMN foi desenvolvida e padronizada pelo Object Management Group. Apesar de notações como BPMN serem úteis em diferentes cenários, ainda é um grande desafio para muitos empregados entender a semântica de um modelo de processo. Se o leitor não está familiarizado com o grande conjunto de conceitos e elementos (por exemplo, gateways, eventos ou atores), partes do processo poderão não ser entendidas ou até mal interpretadas pelo leitor. Inclusive, diversos estudos sobre o entendimento de modelos de processos evidenciaram quão complexo a compreensão de modelos poderia ser, até mesmo para pessoas que estão familiarizadas com modelagem de processo [5], [1]. O treinamento de empregados no entendimento de modelos de processos está associado com uma considerável quantidade de tempo II Workshop de Teses e Dissertações em Sistemas de Informação, Goiânia - GO, 27 de Maio de 2015. e dinheiro e dificilmente poderá ser considerado como uma opção viável para todos os empregados de uma organização. Como uma solução para este problema, muitas organizações mantêm ambos artefatos, modelos e textos. Isto no entanto, significa que as empresas encontram esforços redundantes para atualizar ambos artefatos. O cenário se torna ainda mais crı́tico, considerando que inconsistências podem ocorrer devido a atualização unilateral dos artefatos, em outras palavras, somente um dos artefatos é modificado ou atualizado. Aparentemente, a manutenção em paralelo de ambos artefatos, modelos de processos e instruções de trabalho através de textos, não representa uma solução prática. Este trabalho propõe a criação de uma abordagem bilateral que seja capaz de manter ambos os artefatos (modelos e textos) atualizados automaticamente. Este artigo está dividido nas seguintes seções. Na seção 2 é apresentada a revisão bibliográfica do tema. Na seção 3 é apresentada a proposta deste trabalho para a manutenção automática dos artefatos de processos de negócio. Na seção 4 são apresentados os passos empregados na execução deste trabalho. Finalmente, na Seção 5 são apresentadas as conclusões do trabalho e propostas de trabalho futuro. 2. REVISÃO BIBLIOGRÁFICA Diversas técnicas de verbalização foram propostas para solucionar o problema de inconsistência, permitindo que as organizações evitem trabalho redundante. Estas técnicas permitem um mapeamento direto de modelos conceituais para linguagem natural [7]. Em pesquisas anteriores, elaboramos as primeiras propostas para a transformação de modelos de processos para textos em linguagem natural [4], [9]. Porém, enquanto que esta técnica permite a geração de texto a partir de modelos de processos, não oferece a oportunidade de refletir alterações no texto para o modelo de processo utilizado como entrada. Apesar da existência de algumas técnicas que lidam com o mapeamento de modelos de processos para linguagem natural, até onde sabemos, não existem técnicas que possibilitem a transformação bilateral entre os artefatos, i.e., refletindo as alterações de um modelo de processo para o texto e vice versa (round-trip). Este trabalho propõe a criação de uma abordagem bilateral capaz de interpretar modelos de processos de negócio, escritos em inglês ou em português, mapeando-os para linguagem natural. As alterações detectadas no texto produzido (ou no modelo) deverão ser automaticamente refletidas a fim de manter ambos os artefatos sincronizados. Em particular, o trabalho deverá responder a seguinte pergunta de pesquisa: Como as organizações podem manter ambos artefatos, modelos e textos descritivos de processo, automaticamente sincronizados, tendo em vista que o processo manual está sujeito a falhas na consistência da informação? 3. TÉCNICA PARA MANUTENÇÃO AUTOMÁTICA DE ARTEFATOS Nesta seção é apresentada a técnica para manutentção automatica de artefatos. 3.1 Visão Geral da Técnica A figura 1 detalha a visão geral da arquitetura proposta para a solução bidirecional. A ideia principal da arquitetura é manter um conjunto de correlações entre elementos do mo- 32 Figura 1: Visão geral da solução. delo de processo e do texto gerado. Baseando-se na construção da técnica de geração anterior [9] (passos 1 e 2), tal correlação pode ser produzida automaticamente. O passo 1 é responsável por gerar estruturas intermediárias que armazenam informações sobre o modelo. O passo 2 é responsável por ler tais estruturas e mapeá-las para sentenças em linguagem natural. Se um usuário aplicar alterações no texto em linguagem natural (passo 3), estas alterações serão analisadas pelo Analisador de Alteraç~ oes. As ligações entre os elementos do modelo e sentenças em linguagem natural permite detectar quais elementos do modelo foram afetados pela alteração textual e como estas alterações impactam no modelo original. No passo 4, as alterações no texto são refletidas no modelo de processo. O acionamento do Analisador de Alteraç~ oes está vinculado à detecção de alterações em os ambos artefatos, textos e modelos. Além do projeto dos componentes principais, os objetivos foram estendidos considerando três dimensões importantes: 1. Multilinguistico: Grande parte das organizações internacionais consideram o Inglês como sua linguagem de negócio padrão. Porém, de modo a evitar desentendimentos, muitas empresas ainda criam modelos de processos em sua lı́ngua nativa. Atualmente, todos os trabalhos sobre geração de linguagem natural a partir de modelos de processos, e geração de modelos a partir de textos em linguagem natural, estão limitados para um único idioma [6], [3]. 2. Independência da Linguagem para Modelagem: Na indústria diversas linguagens de modelagem são utilizadas. Frequentemente, encontram-se exemplos de modelos elaborados em BPMN, EPCs e UML. Reconhecendo esta caracterı́stica, será definida uma abordagem bidirecional que não esteja limitada a apenas uma única notação especı́fica (e.g., BPMN). As soluções existentes focam em uma única linguagem de modelagem (e.g., [6], [3]). Será definido um formato de modelagem que seja independente de linguagem, que possa ser mapeado para qualquer notação utilizada para elaboração de modelos de processos. Como resultado, a abordagem bidirecional poderá ser empregada para diferentes linguagens de modelagem. II Workshop de Teses e Dissertações em Sistemas de Informação, Goiânia - GO, 27 de Maio de 2015. 3. Solução User-friendly : É importante definir uma técnica que possa ser eficientemente utilizada na prática. Desta forma, a abordagem desenvolvida será integrada em um editor que esteja disponı́vel ao público, como por exemplo, o editor online Signavio1 . Acreditase que este plug-in será de grande serventia tanto para a indústria, quanto para a academia. 4. METODOLOGIA E CONTRIBUIÇÕES A metodologia a ser aplicada será baseada na proposta de métodos e aplicações destes, além da especificação de experimentos e pesquisas qualitativas [10] para avaliação da abordagem proposta. Detalhando esta metodologia temos: 1. Levantamento e estudo aprofundado sobre o estado da arte nas seguintes áreas: Geração de Linguagem Natural, Modelagem de Processos, Revisão de Teorias e Refinamento de Modelos. 2. Monitoramento de novos trabalhos e propostas publicados em congressos, periódicos e simpósios que estejam no escopo deste trabalho. 3. Desenvolvimento de métodos abordando as propostas do presente trabalho. 4. Avaliação dos métodos desenvolvidos, inicialmente com dados artificiais, o que permitirá um experimento controlado. Posteriormente, serão utilizados dados reais, através de um estudo de caso [8]. O estudo de caso contará com empresas e universidades da Áustria e do Brasil. Tal estudo será possı́vel graças a colaborações estabelecidas entre os paı́ses citados. O estudo permitirá avaliar o comportamento da ferramenta sob condições reais e que não foram definidas a priori. Serão aplicados questionários desenvolvidos pelo aluno (questionário este, que ainda está em elaboração) nas universidades e empresas parceiras, com a ajuda de nossos colaboradores. 5. Avaliação e publicação dos resultados parciais e finais. O processo de experimentação já foi iniciado pelos autores, sendo classificado como “true experimental design” [8], pois técnicas de randomização foram aplicadas durante o processo de seleção das amostras para garantir que os grupos do experimento fossem similares entre si. No total, 73 indivı́duos (estudantes e profissionais de TI) foram selecionados para participar do experimento. Este primeiro experimento teve como objetivo responder a seguinte pergunta de pesquisa: ”Qual representação pode ser entendida mais facilmente pelo usuário, modelos de processo ou textos descritivos, de acordo com a experiência em modelagem de processo?”. Os resultados estão sendo publicados e estarão disponı́veis, caso forem aceitos, no SBES 20152 . O trabalho produz resultados em duas frentes. Por um lado, serão desenvolvidos algoritmos para geração de textos a partir de modelos de processos, para a detecção de alterações feitas no texto gerado e para permitir a atualização automática do modelo original a partir das alterações detectadas. Por outro lado, estes algoritmos serão empacotados 1 www.signavio.com Maiores detalhes podem http://cbsoft.org/sbes2015 2 ser obtidos em 33 em uma ferramenta flexı́vel, capaz de produzir textos a partir de modelos de processos escritos em diferentes idiomas, permitindo a atualização automática do modelo original a partir de alterações no texto. 5. CONCLUSÃO Este trabalho é um empreendimento interdisciplinar. Técnicas e conhecimento sobre diferentes campos de pesquisa, como linguı́stica, processamento de linguagem natural, geração de linguagem natural, modelagem de processo, e engenharia de requisitos precisam ser combinados. Em particular, as seguintes contribuições serão consideradas: (i) Mapear a influência que a experiência do usuário com modelagem de processos pode exercer sobre o entendimento e preferência pela representação de processos, através de textos ou modelos; (ii) Apresentar a correlação entre elementos do modelo de processo e elementos da linguagem natural; (iii) Desenvolvimento de uma abordagem bidirecional, eficiente e efetiva, integrada entre modelos e textos. Por fim, este trabalho tem foco em algoritmos de geração de texto a partir de modelos de processos, permitindo também a atualização de modelos a partir de alterações nos textos gerados e vice-versa. Pretende-se, através dos algoritmos desenvolvidos, a criação de uma ferramenta capaz de gerar um texto em ambas as lı́nguas, português e inglês. 6. REFERÊNCIAS [1] K. Figl and R. Laue. Cognitive complexity in business process modeling. In Advanced Information Systems Engineering, pages 452–466, 2011. [2] R. K. Ko, S. S. Lee, and E. W. Lee. Business process management (bpm) standards: a survey. Business Process Management Journal, 15(5):744–791, 2009. [3] B. Lavoie, O. Rambow, and E. Reiter. The modelexplainer. In Demonstration presented at the Eighth International Workshop on Natural Language Generation, Herstmonceux, Sussex, 1996. [4] H. Leopold, J. Mendling, and A. Polyvyanyy. Generating natural language texts from business process models. In Advanced Information Systems Engineering, pages 64–79. Springer, 2012. [5] J. Mendling, M. Strembeck, and J. Recker. Factors of process model comprehension findings from a series of experiments. Decision Support Systems, 53(1):195–206, 2012. [6] F. Meziane, N. Athanasakis, and S. Ananiadou. Generating natural language specifications from uml class diagrams. Requirements Engineering, 13(1):1–18, 2008. [7] G. M. Nijssen and T. A. Halpin. Conceptual Schema and Relational Database Design: a fact oriented approach. Prentice-Hall, Inc., 1989. [8] J. Recker. Scientific research in information systems: a beginner’s guide. Springer, 2012. [9] R. Rodrigues, L. Azevedo, K. Revoredo, and H. Leopold. A tool to generate natural language text from business process models. In CBSoft 2014 - Tool Session, sep 2014. [10] J. Wainer. Métodos de pesquisa quantitativa e qualitativa para a ciência da computação. Atualização em informática, pages 221–262, 2007.