Tratamento de Dados Pessoais e Discriminação Algorítmica nos Seguros - Ed. 2020

Tratamento de Dados Pessoais e Discriminação Algorítmica nos Seguros - Ed. 2020

Tratamento de Dados Pessoais e Discriminação Algorítmica nos Seguros - Ed. 2020

Tratamento de Dados Pessoais e Discriminação Algorítmica nos Seguros - Ed. 2020

2. Revolução no Tratamento de Dados Pessoais Pelo Segurador: Desafios para Compatibilização Entre Prevenção da Discriminação e Proteção da Privacidade e Eficiência Econômica na Subscrição

2. Revolução no Tratamento de Dados Pessoais Pelo Segurador: Desafios para Compatibilização Entre Prevenção da Discriminação e Proteção da Privacidade e Eficiência Econômica na Subscrição

Entre no Jusbrasil para imprimir o conteúdo do Jusbrasil

Acesse: https://www.jusbrasil.com.br/cadastro

2.1 Novas tecnologias aplicadas na subscrição do seguro e o risco de ampliação da modalidade indireta da discriminação racial

“Não sei qual é o futuro do mercado de seguros. Mas sei que passa por ferramentas que precificam o cliente pelo que ele realmente é. Não queremos mais ter que perguntar idade, sexo e onde ele mora”. 1 Dita por um executivo que atua em importante seguradora brasileira, a frase ilustra tendência de transformação do setor de seguros. Se o seu avanço, principalmente a partir do século XVII, foi arvorado na ciência atuarial, no século XXI ele promete ser movido por outra área do saber: a ciência dos dados.

Demonstrou-se, no primeiro capítulo, que, por serem menos objetivos, estáveis e acessíveis pelo segurador, os “aspectos comportamentais” que individualizariam a figura do proponente não possuíram, tradicionalmente, papel de destaque na classificação dos riscos. Era mais conveniente àquele se valer de poucas variáveis demográficas para precificar o seguro, cobrando um valor médio entre os que compartilhavam tais variáveis. No entanto, e conforme a partir daqui examinado, esses tempos parecem estar com os dias contados.

Tem sido voz corrente que o mercado securitário privado está sendo modificado pelas novas tecnologias de informação e comunicação – havendo quem chegue a afirmar que, na próxima década, ocorrerá evolução equivalente à dos últimos cem anos. 2 O debate internacional em torno dos efeitos de tal revolução (impulsionada por um conjunto de fatores, v.g., Big Data, inteligência artificial, aprendizado de máquina, internet das coisas e computação em nuvem) 3 encontra-se bastante polarizado.

Por um lado, há quem postule que a tecnologia irá empoderar os clientes de seguro e que o “progresso não pode parar”. 4 Numa analogia provocadora, defender-se-ia que a proibição das vantagens digitais equivaleria a voltar-se à fase histórica em que a legitimidade do seguro foi questionada por se acreditar que os danos causados nas pessoas eram oriundos da vontade de Deus, cabendo a cada um suportá-los individualmente.

Por outro lado, o potencial intrusivo, repressor e discriminatório desse “novo mundo” tem despertado inúmeras preocupações. 5 Vedar os olhos a possíveis ilegalidades resultantes do uso de algoritmos alimentados por todos os tipos de dados e supostamente protegidos por segredos comerciais para garantir a livre iniciativa do segurador equivaleria a ser complacente com a reprodução e o próprio agravamento de discriminações que mancharam a trajetória da humanidade.

Bem vistas as coisas, grande parte das discussões não é propriamente inédita, como a conveniência da análise exaustiva do risco pelo segurador para fixação dos termos contratuais e a segmentação do mercado, eventualmente resultando em negação de contratação, e o papel que o seguro privado deve desempenhar na sociedade. O que se alterou, é preciso reconhecer-se, foi o patamar de eficiência das “armas” que os seguradores dispõem em suas mãos para escolher os riscos (e a forma) que aceitarão garantir, por vezes monitorando-os constantemente ao longo do vínculo contratual.

Em síntese perspicaz, Brendan McGurk aponta a mudança de paradigma em andamento: “Os segurados querem evitar as consequências do infortúnio; as seguradoras querem clientes que evitem o infortúnio. Os dois objetivos são reconciliados porque ambos estão operando atrás de um véu de ignorância. Mas o Big Data está começando a levantar o véu”. 6

O referido “levantamento do véu da ignorância”, permitido por uma metodologia de processamento de dados que realiza análise massiva e extremamente veloz de dados estruturados e não estruturados de diversas fontes e formatos em busca de associações, inferências e padrões que possam ser utilizados para dar suporte a tomadas de decisão, traz a reboque delicadas questões. Diante da complexa matemática envolvida, muitas vezes obscura, não regulada, cheia de vieses e de difícil contestação, não falta quem qualifique o processamento via Big Data como uma das “armas de destruição matemática”. 7

No limite, o cenário de avaliação do perfil do segurado mediante programas automáticos decifrando um grande volume de dados poderia ser descrito assim: “Eles serão altamente eficientes, aparentemente arbitrários e totalmente inexplicáveis. Ninguém entenderá sua lógica ou será capaz de explicá-la”, arrematando, na sequência, Cathy O’Neil: “Se não revertemos uma medida de controle, essas futuras armas de destruição matemática parecerão misteriosas e poderosas. Elas farão seu caminho conosco e mal saberemos que isso está acontecendo”. 8

No Brasil, a questão também tem sido considerada de forma receosa. Após destacar que, diante da progressiva do Big Data, há um “considerável aumento da assimetria informacional entre empresas e consumidores, circunstância que coloca em xeque muitas das teorias econômicas que se baseiam na escolha racional ou na soberania dos consumidores”, Ana Frazão faz advertência no sentido de que o “grande desafio da sociedade tecnológica e da informação é encontrar soluções que estimulem a inovação, sem se deixar seduzir pelo discurso traiçoeiro do determinismo tecnológico”, que com frequência “apenas mascara o determinismo econômico”. Por fim, conclui com precisão:

Dessa forma, a tecnologia não pode ser pensada apenas a partir da satisfação dos consumidores e do crescimento econômico, mas também deve ser pensada a partir das condições de realização da cidadania e do crescimento econômico inclusivo e sustentável. Afinal, a inovação não é nem neutra nem necessariamente benéfica, devendo ser submetida ao escrutínio social em face dos valores adotados por cada sociedade e também em âmbito global. 9

Em tom mais comedido, o relatório sobre o uso de Big Data no setor de seguros da Geneva Association enquadra a questão da seguinte forma:

(...) encontrar um equilíbrio adequado entre a proteção da privacidade e permitir a inovação é de fundamental importância, pois a proteção insuficiente da privacidade prejudicará os consumidores e prejudicará a confiança, enquanto uma regulamentação excessivamente rígida pode impedir a sociedade de colher os benefícios dos dados. 10

É preciso concordar com o trecho transcrito; inobstante, como se encontrará o referido equilíbrio apropriado? Falta, nesse ponto, um mínimo de consenso. No próximo item, serão perquiridos os aspectos positivos e negativos relacionados ao crescimento da recolha de dados e o seu tratamento por sistemas de Inteligência Artificial (IA) pelos seguradores. Para melhor compreender os meandros do problema, parece oportuno abordar, previamente, dois pontos. Afinal, quais dados estão sendo utilizados ou poderão sê-los no futuro próximo pelo segurador? E ainda: quais são os instrumentos computacionais capazes de decifrá-los e gerar informações úteis?

No que tange aos dados, é preciso ter em mente tanto a ampliação das fontes quanto dos tipos de dados. Em estudo sobre os birôs de crédito, o ITS divide as fontes de dados em três: i) informações detidas pelo Poder Público; ii) informações coletadas diretamente do titular; e iii) informações obtidas de terceiro privado. Nesse último caso, o terceiro teria de possuir legitimidade para repassar os dados, o que, na prática, nem sempre se verifica. 11 No campo do seguro de automóvel, por exemplo, há relatos de oficinas de carros no exterior repassando dados de seus clientes para seguradoras. 12

Os seguradores dependeram, tradicionalmente, dos dados cedidos diretamente pelos próprios consumidores, no questionário de avaliação do risco, para que pudessem cobrar o prêmio adequado e, de forma mais ampla, gerir o fundo mutual. Além desses dados, que podem ser adjetivados como “dados fornecidos”, hoje o segurador é tecnicamente capaz – não necessariamente permitido em termos jurídicos – de ter acesso a pelo menos outros dois tipos de dados: “observados” e “inferidos”.

Entre os dados observados, o monitoramento do consumidor por meio de uma pulseira fitness possibilitaria ao segurador, à guisa de ilustração, prever se a pessoa pratica, de modo regular, exercícios físicos. Em relação às inferências, o rastreamento das compras do consumidor, por exemplo, via cartões fidelidade de supermercados, poderia levar o segurador a prever se ele pratica ou não atividade físicas, independentemente de esses dois fatos terem uma relação óbvia. No limite, poder-se-ia inferir até que “alguém provavelmente dirige com mais ou menos segurança com base nos grupos que visita no Facebook”. 13

Com efeito, além dos dados há muito utilizados pelos seguradores (relembre-se, gênero, estado civil, idade, alguns hábitos, histórico de sinistros, doenças preexistentes, endereço e profissão), pode-se vislumbrar o potencial de expansão do uso de novos dados “comportamentais” coletados “indiretamente”, como as atividades on-line do proponente (buscas em sites como o Google, compras em sites como a Amazon, utilização de redes sociais), dados oriundos de wearables e telemetria (aplicativos de celulares ou aparelhos que controlam desde os passos do indivíduo até a forma de direção do veículo), 14 dados financeiros provenientes do uso de cartão de crédito etc. (hábitos de compra, renda e score de crédito). 15

Em tese, portanto, estariam ao alcance do segurador inúmeras fontes de dados governamentais públicos, como os registros de propriedades, dados eleitorais e do censo. Esses dados poderiam, ainda, ser complementados pela “tecnologia de rastreamento na web que coleta dados sobre os sites que você visita, seu histórico de pesquisas, o que você compra e onde você gasta seu tempo on-line”. Os smartphones poderiam servir como “ferramentas poderosas de captura de dados com aplicativos que registram sua atividade, localização e comportamento”. 16

Além da pegada digital, algumas seguradoras nos Estados Unidos da América estão requerendo selfies como parte do processo de subscrição. 17 Tamanha invasão à privacidade causaria espanto à maioria das pessoas na realidade atual. Talvez, no futuro, já nem tanto. Importa realçar-se que a permissão de acesso a alguns dados, como a localização, algo extremamente comum quando se baixa um aplicativo no celular, por si só ofereceria munição à formação de um perfil bastante sofisticado pelo segurador, capaz de abranger informações sobre o hábito de o segurado frequentar a academia de ginástica, comer em redes fast-food e ir constantemente a farmácias, tabacarias, bares ou casas noturnas. A partir disso, repise-se, várias inferências poderiam ser geradas e, quiçá, serviriam à fixação do prêmio ou à concessão de descontos ao longo da contratação de um seguro de vida ou de automóvel.

Relativamente à divisão no setor securitário entre o tratamento de “dados tradicionais” e “dados não tradicionais”, consta, em recente paper sobre o uso do Big Data Analytics, da Associação Internacional de Supervisores de Seguros (IAIS, na sigla em inglês), um quadro esclarecedor:

Tabela 2 – Dados tradicionais e não tradicionais no setor segurador

Tipos de dados

Exemplos

Pessoais/ Não pessoais

Utilidade

Fontes de dados

Painel A: Dados tradicionais

Dados demográficos

Idade, gênero, estado civil e familiar, profissão, endereço

Pessoal

Seleção de riscos

Tomadores de seguros

Dados médicos

Histórico médico, condições médicas e de membros da família, teste genético

Pessoal

Seleção de riscos

Tomadores de seguros

Dados de exposição

Tipo de carro, valor do edifício e conteúdo, características das habitações

Pessoal/Não pessoal

Seleção de riscos

Tomadores de seguros

Dados comportamentais

Hábito de fumar e beber, distância dirigida em um ano, escolha de franquia, taxas de cancelamento do seguro de vida

Pessoal/Não pessoal

Seleção de riscos, marketing

Tomadores de seguros, estatísticas da indústria

Dados de sinistros

Relatórios de regulação de sinistros de acidentes de carros, casos de responsabilidade

Pessoal/Não pessoal

Regulação de sinistros

Tomadores de seguros, troca de informações com a indústria

Dados populacionais

Taxas de mortalidade e morbidade e acidentes de carro

Dados pessoais anonimizados e agregados

Seleção de riscos

Governo, estatísticas da indústria, academia

Dados de perigos

Frequência e gravidade de riscos naturais

Não pessoal

Seleção de riscos

Governo, estatísticas da indústria, academia

Outros dados tradicionais

Referência de crédito, relatórios de ajuste de sinistros, informações de oficinas automobilísticas

Pessoal/Não pessoal

Seleção de riscos, marketing, regulação de sinistros

Tomadores de seguros, agentes de crédito, agências, ou parceiros envolvidos na regulação de sinistros

Painel B: Dados novos e “não tradicionais”

Dados IoT (Internet das coisas)

Comportamento do condutor na direção (telemática), atividades físicas e condições médicas(wearables), vigilância (casa inteligente)

Pessoal

Seleção de riscos, regulação de sinistros

Dispositivos de coleta de dados

Dados de mídia on-line

Pesquisas na Web , comportamento de compra on-line, atividades nas mídias sociais

Pessoal

Seleção de riscos, marketing

Empresas de tecnologia (Provedores de Internet, fornecedores de mecanismos de pesquisa, fornecedores de comércio eletrônico, plataformas de mídia social)

Dados de preferências pessoais

Sistema operacional do telefone móvel, endereço de e-mail

Pessoal

Seleção de riscos, marketing, desenvolvimento de produtos

Empresas de tecnologia, Tomadores de seguros

Fonte: INTERNATIONAL ASSOCIATION OF INSURANCE SUPERVISORS. Draft Issues Paper on the Use of Big Data Analytics in Insurance. Basel: IAIS, 2019. p. 9. (Tradução livre).

No Brasil, o tratamento automatizado de “dados não tradicionais” pelo setor segurador está em expansão. Impulsionado pelo fato de algumas seguradoras oferecerem descontos de até 30% no valor do prêmio para “bons motoristas”, o uso de telemetria no seguro de automóvel vem se tornando comum. A maneira de avaliação da direção varia de acordo com a programação de cada seguradora e terá sempre uma margem de subjetividade. A Liberty Seguros, por exemplo, alega utilizar cinco critérios: “velocidade, estilo de condução, distração, fadiga ao volante e momento do dia”. 18

Embora não se saiba ao certo a extensão atual da coleta de dados pelos seguradores no país, é possível supor-se que ela seja mais ampla do que se imagina. Em matéria publicada no Valor Investe, por exemplo, pode-se colher o seguinte relato:

Os dados disponíveis online têm-se mostrado recursos muito relevantes na avaliação de riscos e confirmação de perfis. As seguradoras já estãousando as redes sociais para cruzar informações fornecidas pelo segurado e até validar interesse segurável.

“A melhor forma de entender o consumidor é através do acompanhamento de redes sociais, pesquisas e análise de tendências”, afirma a diretora de vida e longevidade do IRB Brasil RE, Alessandra Monteiro. Para a executiva, “dados sobre estilo de vida, perfil de risco e poder aquisitivo podem auxiliar a subscrição de riscos de vida, por exemplo, de forma surpreendente”. 19

É nesse contexto que se fala no florescimento de canais não tradicionais de dados, que, quando agregados e corretamente tratados, possuem poderes disruptivos no mercado segurador privado. 20 Ao uso das redes sociais – “absoluta mina de ouro de dados” – 21 e outras fontes via Big Data e IA, contrapõe-se, todavia, a posição de vulnerabilidade do consumidor, que teria a sua privacidade devassada e a sua autonomia existencial restringida de forma antes inimaginável.

Em momento oportuno, serão examinados, de maneira crítica, o cenário legal brasileiro e os possíveis impactos da LGPD na matéria, especialmente sob a lente do racismo algorítmico. 22 Por ora, deve-se destacar que a crescente tendência de uso combinado de parte dos dados (tradicionais e não tradicionais) referidos anteriormente só é tecnicamente possível em virtude da sofisticação dos métodos de processamento de dados tradicionais. Na espirituosa colocação de Daniel Martins, os estatísticos estão acostumados com a escassez, e não com a abundância de dados, sendo certo que “as grandes quantidades de dados e a maneira como eles são armazenados tornam os métodos estatísticos simples inaplicáveis”. 23

O tratamento de um volume tão grande e complexo de dados demanda algoritmos automatizados, no geral capazes de autoaprendizagem. Apenas dessa forma é possível extrair-se valor, com a velocidade e precisão que justifiquem tal tratamento. É nesse pano de fundo que alguns conceitos adquirem importância fundamental, tais quais: inteligência artificial, aprendizado de máquina, aprendizado profundo e Big Data. No próximo tópico, será feita uma análise deles; convém, todavia, adiantar-se que a precificação do seguro por algoritmos complexos, não compreensíveis até mesmo para os seus próprios programadores, tem sido observada em alguns países – e isso vem gerando reações ambivalentes entre órgãos reguladores. 24

Da fase pré-contratual (marketing direto e subscrição), passando pela contratual (monitoramento do risco, aferição de agravamento do risco e regulação de sinistro) até a pós-contratual (possibilidade de armazenamento e compartilhamento de dados), toda a atividade securitária tem sido transformada com o avançar da tecnologia no trato de dados. O reconhecimento desse fato é imperioso e coloca ao jurista um desafio: oferecer respostas adequadas aos problemas que dele advêm, sem conservadorismo ou apego infundado à manutenção do statu quo, mas com a preocupação de uma abordagem crítica e propositiva, balanceando o aumento da eficiência, signo predominante do progresso tecnológico, e a tutela da pessoa humana.

É o que se pretende fazer a seguir.

2.1.1 Inteligência artificial e tomada de decisão por algoritmos: o seguro em direção a uma autoestrada ou a um penhasco?

No tópico anterior, foi feita uma introdução acerca do aumento do uso de dados não tradicionais pelos seguradores, por meio da intrínseca união entre Big Data e inteligência artificial. Asseverou-se, ainda, haver forte tendência do que se pode qualificar como uma “subscrição dinâmica”: ao invés de estruturar o seu negócio a “prêmio fixo”, determinado por cálculos atuariais antes da contratação, o segurador passaria a acompanhar os “riscos”, oferecendo recompensas ou reprimendas, de acordo com a observância da conduta dos segurados. 25 Não obstante, mesmo nas relações a “prêmio fixo”, o processo de contratação tende a se transformar, 26 pois, provavelmente, será concluído de forma automatizada e mediante a análise de dados outrora indisponíveis ao segurador.

Seguindo tendência geral de aumento de aquisição on-line dos bens e serviços, as contratações diretas de seguros – avaliadas a partir de decisões automatizadas – devem expandir-se consideravelmente. Na ressalva da Associação Europeia de Seguros:

São esperadas que as avaliações totalmente automatizadas aumentem, pois, com a digitalização, os consumidores exigem cada vez mais serviços de seguros on-line que são simples, eficientes e extremamente rápidos, se não imediatos. Por exemplo, é comum que a decisão sobre o prêmio do seguro de automóvel, residencial e seguro viagem e o contrato de seguro oferecido a um consumidor em potencial sejam baseados apenas no processamento automatizado. 27

Vários aspectos positivos e negativos podem ser indicados a respeito da automatização das decisões relativas à subscrição e do aumento do uso de dados pessoais para servi-la. Antes de se analisar se a mudança de rumo que vem tomando os seguros estaria conduzindo-os em direção a uma autoestrada ou a um penhasco, 28 afigura-se medida recomendável o realce de algumas características da forma de processamento de todos esses dados.

O tratamento dos dados em tela é feito por sistemas de inteligência artificial. Mas, afinal, o que significa isso? De acordo com definição fornecida pelo grupo independente de peritos europeus de alto nível sobre a inteligência artificial, os sistemas de IA são sistemas de:

(...) software (e eventualmente também de hardware) concebidos por seres humanos, que, tendo recebido um objetivo complexo, atuam na dimensão física ou digital percepcionando o seu ambiente mediante a aquisição de dados, interpretando os dados estruturados ou não estruturados recolhidos, raciocinando sobre o conhecimento ou processando as informações resultantes desses dados e decidindo as melhores ações a adotar para atingir o objetivo estabelecido. Os sistemas de IA podem utilizar regras simbólicas ou aprender um modelo numérico, bem como adaptar o seu comportamento mediante uma análise do modo como o ambiente foi afetado pelas suas ações anteriores. 29

Embora seja um conceito complexo e ainda cambiante, a noção da inteligência artificial é de fácil compreensão: à inteligência, atrelada à “capacidade de interpretação da realidade e determinação de uma ação de forma autônoma, independente de comandos anteriores definidos por programação”, soma-se a qualificação artificial, uma vez que, por ser realizada pela máquina, opõe-se “àquela natural, reconhecida aos seres humanos”. 30

Entre a vasta gama de elementos que compõem a IA, vale fazer-se menção a uma diferença fundamental entre algoritmos de análise de dados – que fazem entrecruzamentos de dados estruturados em busca de padrões e correlações – e algoritmos que compõem sistemas capazes de aprender sozinhos por aprendizado de máquinas (machine learning). Apenas o machine learning, com efeito, “é capaz de analisar, fazer correlações e buscar padrões a partir de dados não estruturados: fotos, vídeos, textos, dados coletados por smartphones e sensores”. 31

Entre esses sistemas de aprendizado de máquina, que, sem uma explícita programação, são capazes de se alterarem para melhor efetuarem uma determinada tarefa, há uma subdivisão baseada na supervisão ou não do processo de aprendizado. Enquanto no primeiro é, de forma geral, possível que o programador corrija constantemente o sistema ao longo do seu processo de treinamento e calibragem, e, por fim, verifique minimamente o caminho percorrido pelo algoritmo até a tomada de decisão, no segundo, ou seja, no aprendizado não supervisionado pelo sistema de IA, o desenvolvimento do algoritmo e o racional por trás dos resultados das decisões muitas vezes escapam à possibilidade de compreensão dos seres humano. Exemplo conhecido desse segundo caso são alguns sistemas de IA compostos de redes neurais artificiais que utilizam da técnica de aprendizagem profunda.

Como “os parâmetros de correlações são formulados de maneira independente pelos sistemas a partir da interação com o ambiente dinâmico” e, muitas vezes, por meio de “lógicas incomuns ao raciocínio humano”, 32 o processo de tomada de decisão dos sistemas de IA baseados em redes neurais é muito difícil de ser compreendido. 33 Existem, porém, algumas maneiras de controle pré-processamento, in-processamento e pós-processamento dos dados para se evitar a discriminação oriunda desses sistemas, conforme será visto adiante (infra, 2.2.2 e 3).

Por enquanto, cumpre salientar-se que os sistemas de IAs estão revolucionando os mais variados setores da economia e da sociedade em geral. Suas aplicações no âmbito da medicina, agricultura e políticas públicas, por exemplo, são frequentemente saudadas. Em outros campos, todavia, elas têm despertado uma amálgama de altas expectativas e preocupação, como na polícia preditiva, no sistema judiciário e no recrutamento e seleção de empregados por empresas privadas.

Para além dos inegáveis ganhos de eficiência para o agente de tratamento de dados – mediante a redução de custos e aumento da agilidade –, costuma-se ressaltar que os sistemas de IA possuem como vantagens o fato de produzirem decisões mais acuradas, eficientes, consistentes e justas. Quando comparada a decisões tomadas por humanos – seres falíveis, por vezes temperamentais, suscetíveis ao cansaço, à persuasão e até mesmo a subornos –, aquelas seriam mais objetivas, neutras e, dependendo da modalidade da IA, capazes de serem …

Uma experiência inovadora de pesquisa jurídica em doutrina, a um clique e em um só lugar.

No Jusbrasil Doutrina você acessa o acervo da Revista dos Tribunais e busca rapidamente o conteúdo que precisa, dentro de cada obra.

  • 3 acessos grátis às seções de obras.
  • Busca por conteúdo dentro das obras.
Ilustração de computador e livro
jusbrasil.com.br
3 de Julho de 2022
Disponível em: https://thomsonreuters.jusbrasil.com.br/doutrina/secao/1199047674/2-revolucao-no-tratamento-de-dados-pessoais-pelo-segurador-desafios-para-compatibilizacao-entre-prevencao-da-discriminacao-e-protecao-da-privacidade-e-eficiencia-economica-na-subscricao