Orientações gerais sobre a realização de experimentos A/B

Nesta página, descrevemos como usar experimentos A/B para entender como a Vertex AI Search for Retail está afetando seus negócios.

Visão geral

Um experimento A/B é um experimento aleatório com dois grupos: um grupo experimental e um grupo de controle. O grupo experimental recebe um tratamento diferente (nesse caso, previsões ou resultados da pesquisa da Vertex AI Search for Retail). O grupo de controle não.

Ao executar um experimento A/B, você inclui as informações sobre em qual grupo um usuário estava quando você registrou eventos do usuário. Essas informações são usadas para refinar o modelo e fornecer métricas.

Ambas as versões do aplicativo precisam ser as mesmas, exceto que os usuários no grupo experimental veem resultados gerados pela Pesquisa da Vertex AI para varejo e o grupo de controle não. Você registra eventos de usuário em ambos os grupos.

Para mais informações sobre a divisão de tráfego, consulte Como dividir o tráfego na documentação do App Engine.

Plataformas experimentais

Configure o experimento usando uma plataforma terceirizada, como VWO, ABTasty ou Otimize. Os grupos experimental e de controle recebem um ID de experimento exclusivo da plataforma. Quando você grava um evento de usuário, especificar em qual grupo o usuário está incluindo o ID da experiência na experimentIds. Fornecer o ID do experimento permite que você compare as métricas das versões do aplicativo que aparecem nos grupos de controle e experimental.

Práticas recomendadas para experimentos A/B

O objetivo de um experimento A/B é determinar com precisão o impacto da atualização do seu site (neste caso, a implantação da Vertex AI Search para varejo). Para ter uma medida precisa do impacto, é necessário projetar e implementar o experimento corretamente para que outras diferenças não se influenciem e afetem os resultados.

Para criar um experimento A/B significativo, use as seguintes dicas:

  • Antes de configurar seu experimento A/B, use a previsão ou a visualização de pesquisa para garantir que o modelo esteja se comportando conforme o esperado.

  • Verifique se o comportamento do seu site é idêntico ao do grupo experimental e do grupo de controle.

    O comportamento do site inclui latência, formato de exibição, formato de texto, layout da página, qualidade da imagem e tamanho da imagem. Não pode haver diferenças visíveis para nenhum desses atributos entre a experiência dos grupos de controle e experimental.

  • Aceitar e mostrar os resultados da maneira como são retornados da pesquisa da Vertex AI para varejo e exibi-los na mesma ordem em que são retornados.

    Filtrar itens que estão esgotados é aceitável. No entanto, evite filtros ou organize os resultados com base nas suas regras de negócios.

  • Se você incluir um token de atribuição nos eventos do usuário, verifique se ele está configurado corretamente. Consulte a documentação sobre tokens de atribuição.

  • Verifique se a configuração de exibição fornecida quando você solicita recomendações ou resultados da pesquisa corresponde à sua intenção para essa recomendação ou resultado da pesquisa e o local em que você exibe os resultados.

    Quando você usa recomendações, a configuração de exibição afeta a forma como os modelos são treinados e, portanto, quais produtos são recomendados. Saiba mais.

  • Se você estiver comparando uma solução atual com a Vertex AI para Pesquisa para varejo, mantenha a experiência do grupo de controle separada estritamente da experiência do grupo experimental.

    Se a solução de controle não fornecer uma recomendação ou um resultado da pesquisa, não forneça um da Vertex AI para Pesquisa de varejo nas páginas de controle. Se você fizer isso, os resultados do teste serão distorcidos.

    Certifique-se de que seus usuários não alternem entre o grupo de controle e o grupo experimental. Isso é especialmente importante na mesma sessão, mas também é recomendado em todas as sessões. Isso melhora a performance do experimento ajuda você a obter resultados de testes A/B com significância estatística mais cedo.