Este documento no Google Cloud Well-Architected Framework: perspetiva de FSI oferece uma vista geral dos princípios e das recomendações para otimizar o desempenho das suas cargas de trabalho da indústria de serviços financeiros (FSI) no Google Cloud. As recomendações neste documento estão alinhadas com o pilar de otimização do desempenho da Well-Architected Framework.
A otimização do desempenho tem uma longa história nos serviços financeiros. Ajudou as organizações de serviços financeiros a ultrapassar os desafios técnicos e tem sido quase sempre um facilitador ou um acelerador para a criação de novos modelos de negócio. Por exemplo, as caixas multibanco (introduzidas em 1967) automatizaram o processo de dispensa de dinheiro e ajudaram os bancos a diminuir o custo da sua atividade principal. As técnicas como ignorar o kernel do SO e fixar threads de aplicações aos núcleos de computação ajudaram a alcançar uma latência determinística e baixa para as aplicações de negociação. A redução da latência facilitou uma liquidez mais elevada e firme com spreads mais apertados nos mercados financeiros.
A nuvem cria novas oportunidades de otimização do desempenho. Também desafia alguns dos padrões de otimização historicamente aceites. Especificamente, as seguintes concessões são mais transparentes e controláveis na nuvem:
- Tempo de colocação no mercado versus custo.
- Desempenho global ao nível do sistema em comparação com o desempenho ao nível do nó.
- Disponibilidade de talentos versus agilidade da tomada de decisões relacionadas com tecnologia.
Por exemplo, adaptar o hardware e os recursos de TI a requisitos de competências específicos é uma tarefa simples na nuvem. Para suportar a programação de GPUs, pode criar facilmente VMs baseadas em GPUs. Pode dimensionar a capacidade na nuvem para acomodar picos de procura sem aprovisionar recursos em excesso. Esta capacidade ajuda a garantir que as suas cargas de trabalho conseguem processar picos de carga, como nos dias de folha de pagamentos não agrícola e quando os volumes de negociação são significativamente superiores aos níveis históricos. Em vez de gastar recursos na escrita de código altamente otimizado ao nível de servidores individuais (como código altamente ajustado na linguagem C) ou na escrita de código para ambientes de computação de alto desempenho (HPC) convencionais, pode expandir de forma ideal através de um sistema distribuído baseado em Kubernetes bem arquitetado.
As recomendações de otimização do desempenho neste documento estão mapeadas para os seguintes princípios fundamentais:
- Alinhe as métricas de desempenho da tecnologia com os principais indicadores empresariais
- Priorize a segurança sem sacrificar o desempenho por riscos não comprovados
- Repense a sua arquitetura para se adaptar a novas oportunidades e requisitos
- Prepare a sua tecnologia para o futuro de forma a satisfazer as necessidades empresariais atuais e futuras
Alinhe as métricas de desempenho da tecnologia com os principais indicadores empresariais
Pode mapear a otimização do desempenho para resultados de valor empresarial de várias formas. Por exemplo, num departamento de investigação de compras, um objetivo empresarial pode ser otimizar o resultado por hora de investigação ou dar prioridade a experiências de equipas com um histórico comprovado, como ratios de Sharpe mais elevados. Do lado das vendas, pode usar as estatísticas para acompanhar o interesse dos clientes e, em conformidade, dar prioridade ao débito para modelos de IA que suportem a investigação mais interessante.
A associação dos objetivos de desempenho aos indicadores essenciais de desempenho (IEDs) da empresa também é importante para financiar as melhorias de desempenho. As iniciativas de inovação e transformação empresarial (por vezes, denominadas esforços de mudança da instituição financeira) têm orçamentos diferentes e, potencialmente, diferentes graus de acesso a recursos em comparação com as operações normais (BAU) ou de gestão da instituição financeira. Por exemplo, Google Cloud ajudou as equipas de gestão de riscos e tecnologia de uma G-SIFI a colaborar com os analistas quantitativos da linha de frente numa solução para fazer cálculos de estatísticas de risco (como XVA) em minutos, em vez de horas ou dias. Esta solução ajudou a organização a cumprir os requisitos de conformidade relevantes. Também permitiu que os negociadores tivessem conversas de maior qualidade com os seus clientes, oferecendo potencialmente spreads mais apertados, liquidez mais firme e cobertura mais rentável.
Quando alinhar as métricas de desempenho com os indicadores empresariais, tenha em consideração as seguintes recomendações:
- Associe cada iniciativa tecnológica aos objetivos e resultados principais (OKRs) da empresa relevantes, como aumentar a receita ou o lucro, reduzir os custos e mitigar o risco de forma mais eficiente ou holística.
- Foque-se na otimização do desempenho ao nível do sistema. Olhe para além da separação convencional entre a mudança de banco e a gestão do banco, e dos silos entre o front-office e o back-office.
Dê prioridade à segurança sem sacrificar o desempenho por riscos não comprovados
A segurança e a conformidade regulamentar nas organizações de FSI têm de ser inequivocamente de um padrão elevado. Manter um padrão elevado é essencial para evitar a perda de clientes e impedir danos irreparáveis na marca de uma organização. Muitas vezes, o valor mais elevado é derivado de inovações tecnológicas, como a IA generativa, e de serviços geridos únicos, como o Spanner. Não rejeite automaticamente essas opções tecnológicas devido a uma conceção errada generalizada sobre o risco operacional proibitivo ou a postura de conformidade regulamentar inadequada.
Google Cloud trabalhou em estreita colaboração com os G-SIFIs para garantir que é possível usar uma abordagem baseada em IA para o combate ao branqueamento de capitais (AML) nas jurisdições onde as instituições prestam serviços aos clientes. Por exemplo, a HSBC melhorou significativamente o desempenho da sua unidade de crimes financeiros (Fincrime) com os seguintes resultados:
- Quase duas a quatro vezes mais atividade suspeita confirmada.
- Redução dos custos operacionais devido à eliminação de mais de 60% dos falsos positivos e tempo de investigação focado apenas em alertas acionáveis de alto risco.
- Resultados auditáveis e explicáveis para apoiar a conformidade regulamentar.
Considere as seguintes recomendações:
- Confirme se os produtos que pretende usar podem ajudar a cumprir os requisitos de segurança, resiliência e conformidade para as jurisdições onde opera. Para alcançar este objetivo, trabalhe com as Google Cloud equipas de contas, as equipas de risco e as equipas de produtos.
- Crie modelos mais poderosos e ofereça transparência aos clientes através da explicação da IA (por exemplo, a atribuição de valor de Shapley). As técnicas como a atribuição de valor de Shapley podem atribuir decisões do modelo a funcionalidades específicas ao nível da entrada.
Alcance a transparência para cargas de trabalho de IA generativa usando técnicas como citações de fontes, fundamentação e RAG.
Quando a capacidade de explicação não é suficiente, separe os passos de tomada de decisão nas suas streams de valor e use a IA para automatizar apenas os passos que não envolvem tomada de decisão. Em alguns casos, a IA explicável pode não ser suficiente ou um processo pode exigir intervenção humana devido a preocupações regulamentares (por exemplo, o Artigo 22 do RGPD). Nestes casos, apresente todas as informações de que o agente humano precisa para tomar decisões num único painel de controlo, mas automatize as tarefas de recolha, carregamento, manipulação e resumo de dados.
Repense a sua arquitetura para se adaptar a novas oportunidades e requisitos
Aumentar as suas arquiteturas atuais com capacidades baseadas na nuvem pode oferecer um valor significativo. Para alcançar resultados mais transformadores, tem de repensar periodicamente a sua arquitetura através de uma abordagem baseada na nuvem.
Considere as seguintes recomendações para repensar periodicamente a arquitetura das suas cargas de trabalho de modo a otimizar ainda mais o desempenho.
Use alternativas baseadas na nuvem aos sistemas e aos programadores de HPC no local
Para tirar partido de uma maior elasticidade, de uma postura de segurança melhorada e de capacidades de monitorização e governação extensivas, pode executar cargas de trabalho de HPC na nuvem ou aumentar as cargas de trabalho no local para a nuvem. No entanto, para determinados exemplos de utilização de modelagem numérica, como a simulação de estratégias de investimento ou a modelagem de XVA, a combinação do Kubernetes com o Kueue pode oferecer uma solução mais eficaz.
Mude para a programação baseada em gráficos para simulações
As simulações de Monte Carlo podem ter um desempenho muito melhor num sistema de execução baseado em gráficos, como o Dataflow. Por exemplo, o HSBC usa o Dataflow para executar cálculos de risco 16 vezes mais rápido em comparação com a abordagem anterior.
Execute plataformas de negociação e câmbios baseados na nuvem
As conversas com os Google Cloud clientes revelam que o princípio de Pareto 80/20 aplica-se aos requisitos de desempenho dos mercados e das aplicações de negociação.
- Mais de 80% das aplicações de negociação não precisam de uma latência extremamente baixa. No entanto, tiram partido de vantagens significativas das capacidades de resiliência, segurança e elasticidade da nuvem. Por exemplo, BidFX, uma plataforma de vários negociadores de câmbios usa a nuvem para lançar novos produtos rapidamente e aumentar significativamente a respetiva disponibilidade e presença sem aumentar os recursos.
- As restantes aplicações (menos de 20%) precisam de baixa latência (menos de um milissegundo), determinismo e equidade na entrega de mensagens. Convencionalmente, estes sistemas são executados em instalações de alojamento conjunto rígidas e caras. Cada vez mais, mesmo esta categoria de aplicações está a ser reformulada na nuvem, quer no limite ou como aplicações concebidas para a nuvem.
Prepare a sua tecnologia para o futuro de forma a satisfazer as necessidades empresariais atuais e futuras
Historicamente, muitas organizações de FSI criaram tecnologias proprietárias para obter uma vantagem competitiva. Por exemplo, no início dos anos 2000, os bancos de investimento e as empresas de negociação bem-sucedidos tinham as suas próprias implementações de tecnologias fundamentais, como sistemas de publicação/subscrição e agentes de mensagens. Com a evolução das tecnologias de código aberto e da nuvem, essas tecnologias tornaram-se mercadorias e não oferecem valor empresarial incremental.
Considere as seguintes recomendações para preparar a sua tecnologia para o futuro.
Adote uma abordagem de dados como serviço (DaaS) para um tempo de comercialização mais rápido e transparência de custos
As organizações de FSI evoluem frequentemente através de uma combinação de crescimento orgânico e fusões e aquisições (M&A). Como resultado, as organizações têm de integrar tecnologias distintas. Também têm de gerir recursos duplicados, como fornecedores de dados, licenças de dados e pontos de integração.A Google Cloud oferece oportunidades para criar valor diferenciado nas integrações pós-fusão.
Por exemplo, pode usar serviços como a partilha do BigQuery para criar uma plataforma de dados como serviço (DaaS) pronta para análise. A plataforma pode fornecer dados de mercado e informações de origens alternativas. Esta abordagem elimina a necessidade de criar pipelines de dados redundantes e permite-lhe focar-se em iniciativas mais valiosas. Além disso, as empresas unidas ou adquiridas podem racionalizar de forma rápida e eficiente as respetivas necessidades de licenciamento de dados e infraestrutura após a fusão. Em vez de se esforçar para adaptar e unir os dados e as operações existentes, a empresa combinada pode concentrar-se em novas oportunidades de negócio.
Crie uma camada de abstração para isolar os sistemas existentes e abordar os modelos de negócio emergentes
Cada vez mais, a vantagem competitiva dos bancos não é o sistema bancário principal, mas sim a camada da experiência do cliente. No entanto, os sistemas bancários antigos usam frequentemente aplicações monolíticas que foram desenvolvidas em linguagens como Cobol e estão integradas em toda a cadeia de valor bancária. Esta integração dificultou a separação das camadas da cadeia de valor, pelo que era quase impossível atualizar e modernizar esses sistemas.
Uma solução para resolver este desafio é usar uma camada de isolamento, como um sistema de gestão de APIs, ou uma camada de preparação, como o Spanner, que duplica o registo de dados e facilita a modernização dos serviços com estatísticas avançadas e IA. Por exemplo, o Deutsche Bank usou o Spanner para isolar o respetivo sistema bancário central antigo e iniciar o seu percurso de inovação.