Como o Data Fabric está moldando as fábricas flexíveis e adaptáveis da Indústria 4.0

O acesso uniforme a fontes de dados distribuídas e heterogêneas é a chave para a nova geração de fábricas inteligentes e altamente adaptáveis da Indústria 4.0.

Por: Luís Albejante 07/12/2020  

Coletar e analisar dados para derivar conclusões e ações a partir deles - essa é essencialmente a tríade dos sistemas de autoaprendizagem. Eles são a base da transição de processos automatizados para autônomos e, portanto, adaptáveis na fabricação. Os objetivos típicos são melhorar a eficácia geral do equipamento e estabelecer novos negócios digitais.

Na usinagem, por exemplo, os processos de aprendizado de máquina podem medir digitalmente a qualidade da superfície de uma peça, enquanto algoritmos e regras dinâmicas geram recomendações ou acionam ações automáticas: como classificar a peça, ajustar as etapas de produção subsequentes ou otimizar o processo.

Para fazer isso, a empresa de manufatura deve modelar digitalmente a lógica de produção e os recursos de fabricação, fornecendo-lhes acesso aos parâmetros de qualidade e processo relevantes. Ao correlacionar parâmetros de processo e de qualidade, são gerados modelos de dados que permitem o controle contínuo e a otimização da produção.

A teoria é um lado da moeda. Na prática, as empresas de manufatura enfrentam um dilema que surge dos requisitos do ciclo de dados. Esses requisitos, o dilema e uma estratégia de solução são descritos a seguir.

Ciclo de dados entre locais de produção e plataformas centralizadas

A qualidade dos modelos de dados depende muito da quantidade e da qualidade do "material de aprendizagem". Um técnico de manutenção pode levar anos até saber o comportamento exato de uma única máquina, para que possa identificar ou evitar um mau funcionamento em um estágio inicial. Se alguém pudesse agregar a experiência com centenas ou milhares de máquinas semelhantes, o processo de aprendizado poderia ser reduzido para semanas ou dias.

Isso acontece quando você coleta dados de máquinas semelhantes ou etapas de produção de locais diferentes e alimenta-os em um modelo de dados de autoaprendizagem. Quanto mais dados relevantes estiverem disponíveis, mais rápido e melhor será o efeito de aprendizagem. Isso é chamado efeito de rede de dados. Os dados industriais, em particular, têm um potencial considerável para criar vantagens competitivas sustentáveis ​​por meio de tais efeitos.


Continua depois da publicidade


Não apenas os dados diretamente envolvidos no processo de fabricação são relevantes para o treinamento do modelo. Continuando com o exemplo de usinagem: não somente os dados sobre rugosidade da superfície, processo de fresagem, avanço ou profundidade de corte, mas também, por exemplo, valores medidos da fresagem na própria máquina (como vibração), informações ambientais (como umidade), bem como parâmetros logísticos e de negócios, como sistemas ERP.

Os modelos, algoritmos e regras treinadas controlam a análise de dados e ação durante o processo de produção. Dependendo do processo, isso pode exigir tempos de resposta baixos (latência) até o processamento em tempo real. É por isso que a análise de dados normalmente é feita nas fábricas próximas às máquinas, usando sistemas industriais de ponta que atuam como a interface entre os sistemas industriais e de TI. Eles garantem que a análise e a ação possam ocorrer sem transferência de dados para centros de dados remotos ou nuvens, a fim de garantir a maior estabilidade possível do processo.

Isso resulta em um ciclo de dados permanente entre locais de manufatura distribuídos e plataformas centralizadas. Os modelos de dados são continuamente aprimorados em um ponto central com a ajuda dos dados gerados nos locais de produção. Esses, por sua vez, utilizam os modelos, algoritmos e regras pré-treinadas para controle do processo operacional.

Evite ilhas de dados e dependências

Para construir esse ciclo de dados ao longo de toda a cadeia de valor, os dados devem ser integrados tanto vertical quanto horizontalmente. Com a integração vertical, os dados de máquinas ou sistemas são transmitidos para IoT centralizado ou plataformas em nuvem. Pode ser, por exemplo, a temperatura e o nível da vibração com o respectivo registro do horário, que são regularmente amostrados e visualizados ou processados ​​em um sistema central.

Ao fazer isso, as empresas de manufatura enfrentam um dilema. Se elas usarem as plataformas IoT de seus vários fabricantes de máquinas com uma seleção dos top de linha, eles criarão ilhas de dados que tornam a análise geral e o controle mais difíceis. A complexidade que já existe em ambientes de fabricação é cimentada ou aumentada ainda mais - ou seja, a típica "arquitetura espaguete", em que vários bancos de dados, ferramentas de análise e aplicativos são interligados por interfaces individuais. No entanto, se as empresas confiarem apenas em uma ou algumas plataformas em nuvem para reduzir a complexidade, a dependência dessas plataformas aumentará.

A integração horizontal de dados pode resolver esses problemas. Com essa abordagem, os dados não são transferidos para um local central, mas vinculados uns aos outros por uma camada de dados separada. Daí o nome "data fabric", ou tecido de dados, que significa uma malha de conexões.

Controle o ciclo de dados com um data fabric

Uma malha de dados combina sistemas de arquivos distribuídos e heterogêneos por abstração em um usuário único ou global. Como resultado, as empresas de manufatura obtêm um acesso uniforme aos dados e arquivos que podem ser distribuídos em uma ampla variedade de sistemas e em tantos locais quantos forem necessários. Isso permite o gerenciamento holístico de dados, por exemplo, para controlar os direitos de acesso e outros requisitos de conformidade. A malha de dados também organiza o ciclo de dados descrito acima. É o núcleo por meio do qual os locais de produção, serviços em nuvem e empresas parceiras são integradas nesse ciclo como fornecedores ou destinatários de dados e modelos analíticos.

Com essa abordagem, o problema de complexidade pode ser resolvido porque há um acesso consolidado aos dados, e a interação entre aplicativos, fontes de dados e bancos de dados é organizada por intermédio de uma camada uniforme de informações. Ele também resolve o problema de dependência porque a empresa de manufatura controla o ciclo - ou seja, não as plataformas externas que integram os clientes como uma aranha em sua própria teia. Mesmo ao usar várias plataformas externas, a uniformidade da arquitetura de dados é preservada. Uma empresa de manufatura pode, portanto, reduzir adicionalmente sua dependência com uma estratégia de vários fornecedores, sem ter de temer complexidade excessiva ou ilhas de dados.

Blocos de construção de um data fabric

A malha de dados é baseada em uma arquitetura aberta e transparente. Os componentes mais importantes ao longo da aquisição, agregação, análise e ação da cadeia de processo são descritos abaixo.

- Aquisição: a aquisição de dados ocorre por meio de módulos de software que acessam os dados via interfaces de programação de aplicativos. Pode ser o banco de dados SQL do sistema ERP, os dados do sensor de uma máquina ou o banco de dados NoSQL de um aplicativo em nuvem. Os módulos de software convertem os respectivos protocolos industriais em pacotes IP e, assim, capturam a variedade de fontes de dados.

- Agregação: os dados fluem dos sistemas de origem para a malha de dados através de pipelines de dados, a fim de torná-los acessíveis aos aplicativos de destino usando sistemas de mensagens. Nesse contexto, os dados são frequentemente selecionados e compactados, uma vez que geralmente nem todos os dados de origem são relevantes para processamento posterior. Além disso, os dados podem ser armazenados em um local denominado data lake. O data lake agrega a riqueza de dados heterogêneos relacionados à produção para criar o maior banco de dados possível para aprendizado de máquina. Ao contrário de um data warehouse tradicional, um data lake pode ser distribuído em vários locais e ambientes - como locais de produção, data centers ou nuvens. Os controles de multilocação gerenciam quais usuários têm permissão para acessar quais dados e de que maneira. Isso significa que o data lake distribuído também pode ser usado por várias empresas sem afetar a soberania dos dados das partes envolvidas.

- Análise: usando toques de dados, os analistas podem acessar os dados operacionais circulantes e o data lake distribuído para experimentar, treinar, refinar e atualizá-los continuamente. Usando a análise de fluxo - a análise em tempo real de fluxos de dados de eventos - os modelos treinados são então usados ​​para monitorar os dados do sensor da produção em andamento. Por exemplo, você pode reconhecer desvios ou clusters conspícuos que indicam problemas de funcionamento emergentes. A análise de fluxo é a base para ações autônomas em operações, bem como para intervenções de médio prazo, como manutenção preditiva.

- Ação: as ações são acionadas com base em algoritmos ou lógicas de negócios, como abrir um pedido de serviço, caso uma máquina não produza mais a qualidade desejada devido ao desgaste. Além disso, os processos posteriores podem ser adaptados com base nesse conhecimento para trazer a qualidade de volta à faixa de tolerância. Isso é chamado de sistemas de auto-otimização ou autônomos.

Contêineres como base tecnológica

A virtualização de contêiner é usada como base tecnológica para a malha de dados. Isso permite que a lógica de negócios do data fabric seja distribuída entre locais de produção e logística, data centers e nuvens, ao mesmo tempo em que é operada de maneira uniforme. A orquestração de contêineres com o Kubernetes são os meios de escolha atuais para criar aplicativos distribuídos e amplamente independentes de plataforma. O problema da persistência de dados também pode ser resolvido hoje, de forma que aplicativos monolíticos - como MES ou PPS - possam ser armazenados em contêineres. Isso dá às empresas a vantagem inestimável de um ambiente homogêneo com vantagens de eficiência e transparência correspondentes na operação.

Ao construir essa malha de dados, toda empresa precisa responder à questão de fazer ou comprar. Hoje há uma abundância de tecnologias e ferramentas de código aberto disponíveis que as empresas podem usar para construir seu próprio data fabric. A alternativa para isso são produtos comerciais padrão. Isso inclui soluções como sistemas de arquivos distribuídos altamente escalonáveis, com os quais volumes de dados na faixa de petabytes podem ser gerenciados com alto desempenho. São componentes principais desse tipo de solução, que são usados para construir malhas de dados e para a conteinerização de ambientes de aplicativos. A plataforma também suporta a análise de fontes de dados distribuídas e inclui funções para armazenamento persistente de dados em ambientes de contêiner.

Conclusão

Com um data fabric, as empresas de manufatura podem criar os efeitos de rede necessários para desbloquear o potencial de valor de seus dados - por exemplo, na forma de maior eficiência operacional ou tornando-se uma plataforma digital que oferece serviços digitais aos seus clientes. A malha de dados representa o hub de dados que permite a troca e o controle de dados e lógica de processo. Fontes de dados externas também podem ser acessadas e partes externas podem ter acesso controlado à malha de dados, permitindo efeitos de rede entre empresas.

Com essa abordagem, as empresas permanecem amplamente independentes da IoT central ou das plataformas de nuvem pois obtêm efeitos de rede por meio de uma arquitetura descentralizada que está sob seu próprio controle. Os serviços de nuvem externa continuam sendo recursos indispensáveis porque têm ferramentas e recursos de agregação excelentes. No entanto eles podem ser usados a partir de uma posição de soberania, ou seja, com controle dos dados e do valor agregado resultante.

Gostou? Então compartilhe:

Luís Albejante

O autor é diretor de produtos da Hewlett Packard Enterprise Brasil.