Pular para o conteúdo principal

datasetWanderbricks

O esquema wanderbricks no catálogo samples contém um dataset simulado de plataforma de reserva de viagens. Ele simula um marketplace de aluguel de temporada, com tabelas que abrangem usuários e anfitriões, anúncios de imóveis e destinos, reservas e pagamentos, avaliações e logs de suporte, além da atividade de fluxo de cliques.

Use esse dataset para explorar pipeline de engenharia de dados, painéis analíticos e fluxo de trabalho de machine learning sem carregar seus próprios dados.

Acesse o dataset

O dataset Wanderbricks está pré-carregado no catálogo samples e está disponível no espaço de trabalho habilitado para catálogo do Unity.

Para listar todas as tabelas no esquema:

SQL
SHOW TABLES IN samples.wanderbricks;

Para pré-visualizar os dados em uma tabela específica:

SQL
SELECT *
FROM samples.wanderbricks.<table-name>
LIMIT 10;

Substitua <table-name> pela tabela que você deseja explorar, por exemplo bookings ou reviews.

Tabelas

O esquema wanderbricks inclui as seguintes tabelas. execução SHOW TABLES IN samples.wanderbricks para a lista completa.

Tabela

Descrição

users

Perfis de usuário, incluindo nome, email, país e tipo de usuário.

hosts

Perfis de anfitriões vinculados a anúncios de imóveis, incluindo detalhes account e de contato.

properties

Listagens de imóveis com detalhes como título, tipo, preço e destino.

bookings

Registros de reservas com datas de check-in/check-out, número de hóspedes, valores totais e status.

payments

Registros de pagamento com método, valor, status e referências de reserva.

booking_updates

Reserva de registros de mudança de estado para pipeline de captura de dados de alterações (CDC).

reviews

Avaliações de usuários para propriedades, incluindo classificações, comentários e um indicador is_deleted para exclusões lógicas.

clickstream

Eventos de atividade do usuário (visualizações, cliques, pesquisas, filtros) com metadados aninhados para dispositivo e site de referência.

page_views

Eventos view de página vinculados a usuários e propriedades.

customer_support_logs

logs de chamados de suporte com matrizes aninhadas de mensagens, incluindo remetente e sentimento.

destinations

Destinos turísticos com nomes e descrições, mencionados nos anúncios de imóveis.

Relações da tabela primária

O diagrama a seguir mostra as conexões entre usuários, reservas, propriedades e tabelas relacionadas.

Diagrama de relacionamento entre as tabelas principais do Wanderbricks, mostrando as conexões entre usuários, reservas, propriedades e tabelas relacionadas.

  • Usuários e anfitriões

    • users Representa viajantes e clientes empresariais.
    • hosts Representa proprietários e operadores de imóveis.
  • Propriedades e destinos

    • Cada linha em properties é uma listagem pertencente a um anfitrião.
    • properties links para destinations para modelar onde o anúncio está localizado.
  • Reservas e pagamentos

    • bookings conecta viajantes (user_id) a propriedades (property_id).
    • payments e booking_updates faz referência booking_id para capturar transações financeiras e mudanças de status.
  • Comportamento e experiência

    • clickstream e page_views rastreiam como os usuários navegam e interagem com os anúncios.
    • reviews Captura o feedback do usuário e da propriedade após a estadia.
    • customer_support_logs Os registros dão suporte a interações vinculadas a um usuário.

Exemplos de consultas

Os exemplos a seguir mostram como consultar o dataset Wanderbricks.

Junte-se a usuários, reservas e propriedades.

Retornar reservas recentes com detalhes do hóspede e da propriedade:

SQL
SELECT
u.name AS guest_name,
p.title AS property_title,
b.check_in,
b.check_out,
b.total_amount,
b.status
FROM samples.wanderbricks.bookings AS b
JOIN samples.wanderbricks.users AS u
ON b.user_id = u.user_id
JOIN samples.wanderbricks.properties AS p
ON b.property_id = p.property_id
ORDER BY b.check_in DESC
LIMIT 10;

Analise eventos de fluxo de cliques por dispositivo.

Resuma o engajamento por tipo de evento e dispositivo:

SQL
SELECT
metadata.device AS device_type,
event,
COUNT(*) AS event_count
FROM samples.wanderbricks.clickstream
GROUP BY metadata.device, event
ORDER BY event_count DESC;

Calcular a classificação média por propriedade.

Encontre os imóveis mais bem avaliados com um volume suficiente de avaliações:

SQL
SELECT
p.title AS property_title,
p.property_type,
ROUND(AVG(r.rating), 2) AS avg_rating,
COUNT(r.rating) AS review_count
FROM samples.wanderbricks.properties AS p
JOIN samples.wanderbricks.reviews AS r
ON p.property_id = r.property_id
WHERE r.is_deleted = false
GROUP BY p.title, p.property_type
HAVING COUNT(r.rating) >= 5
ORDER BY avg_rating DESC
LIMIT 10;