Optimize Tableau Performance /Optimiser les performances de Tableau

Learning Objectives /Objectifs de formation

After completing this unit, you’ll be able to: /Une fois cette unité terminée, vous pourrez :

  • Explain native optimization features in Tableau. /Expliquer les fonctionnalités d’optimisation natives de Tableau.
  • Explain best practices for optimizing queries in Tableau. /Expliquer les meilleures pratiques pour optimiser les requêtes dans Tableau.

Meet Modern Data Challenges Head-On /Relevez les défis des données modernes

laptop with Tableau Prep on screen

In Tableau Basics, you learn that the volume, state, and diversity of data impacts how fast you can make business decisions. There’s so much data out there. It sits on more and more platforms and services. And the information is in many different formats. /Dans Tableau Basics, vous apprenez que le volume, le statut et la diversité des données ont un impact sur la rapidité avec laquelle vous pouvez prendre des décisions commerciales. Il y a tellement de données là-bas. Il se trouve sur de plus en plus de plateformes et de services. Et les informations sont dans de nombreux formats différents.

Your company might be just beginning to untangle its data challenges. Perhaps it’s already invested in certain data and analytics platforms. The most important thing at this moment is that you’re taking steps to continuously improve your analytics. Keep working to make data easier to access and read, so your business can make informed decisions quickly. /Votre entreprise commence peut-être à démêler ses défis en matière de données. elle a peut-être déjà investi dans certaines plates-formes de données et d’analyse. La chose la plus importante en ce moment est que vous prenez des mesures pour améliorer continuellement vos analyses. Continuez à travailler pour rendre les données plus faciles d’accès et facile à lire, afin que votre entreprise puisse prendre rapidement des décisions éclairées.

In this module, you learn about the performance tuning and optimization features for a Tableau and Google BigQuery integration. You get a glimpse at how these platforms work together to solve your big data challenges, all in a no-code environment. /Dans ce module, vous découvrez les fonctionnalités de réglage et d’optimisation des performances pour une intégration Tableau et Google BigQuery. Vous obtenez un aperçu de la manière dont ces plates-formes fonctionnent ensemble pour résoudre vos défis de Big Data, le tout dans un environnement sans code.

Let’s start with Tableau. /Commençons par Tableau.

Get Familiar with Tableau Native Optimization /Familiarisez-vous avec l’optimisation native de Tableau

There are a number of optimizations that Tableau does automatically to make the integration with Google BigQuery efficient and fast. Here is a short list. /Il existe un certain nombre d’optimisations que Tableau effectue automatiquement pour rendre l’intégration à Google BigQuery efficace et rapide. Voici une courte liste.

Data source connector. This is the native Tableau connector to Google BigQuery. It supports both live data connections and in-memory extraction. It also supports mashup data from BigQuery with other data sources. /Data source connector. Il s’agit du connecteur Tableau natif de Google BigQuery. Il prend en charge les connexions de données en direct et l’extraction en mémoire. Il prend également en charge les données de mashup de BigQuery avec d’autres sources de données.

Parallel queries. Tableau supports multiple queries at the same time, up to 16 concurrent queries. See how you can optimize parallel queries even further in the next section. /Parallel queries. Tableau prend en charge plusieurs requêtes en même temps, jusqu’à 16 requêtes simultanées. Découvrez comment optimiser davantage les requêtes parallèles dans la section suivante.

Query fusion. This is the ability to take multiple queries from workbooks and dashboards and fuse them together. Tableau does this whenever possible to reduce the number of queries at any given time. /Query fusion Il s’agit de la possibilité de prendre plusieurs requêtes à partir de classeurs et de tableaux de bord et de les fusionner. Tableau le fait chaque fois que possible pour réduire le nombre de requêtes à un moment donné.

External query cache. You may be familiar with caching from website behavior—if the data hasn’t changed, your browser saves time by serving you elements of a website that have been saved locally. Tableau does something similar. If the underlying data hasn’t changed, Tableau caches queries and provides you with the data almost instantaneously. /External query cache. Vous connaissez peut-être la mise en cache du comportement du site Web: si les données n’ont pas changé, votre navigateur gagne du temps en vous proposant des éléments d’un site Web qui ont été enregistrés localement. Tableau fait quelque chose de similaire. Si les données sous-jacentes n’ont pas changé, Tableau met en cache les requêtes et vous fournit les données presque instantanément.

There’s more happening in the background, but this gives you an overview of how Tableau works to help businesses make decisions fast. There are also tools built in to optimize analytics even more based on your specific business needs. /Il se passe plus de choses en arrière-plan, mais cela vous donne un aperçu de la façon dont Tableau fonctionne pour aider les entreprises à prendre des décisions rapidement. Il existe également des outils intégrés pour optimiser encore plus l’analyse en fonction de vos besoins commerciaux spécifiques.

Know the Tools for Tableau Optimization /Connaître les outils d’optimisation de Tableau

Tableau was built to bring data analytics to everyone—no need to have technical skills or knowledge of specialized analytics code to use the platform./Tableau a été conçu pour offrir l’analyse de données à tout le monde – pas besoin de compétences techniques ou de connaissances en code d’analyse spécialisé pour utiliser la plate-forme.

As you connect to more data sources, such as Google BigQuery, make sure to keep your Tableau environment performing at its best. These tools and features are here to help you. /Lorsque vous vous connectez à davantage de sources de données, telles que Google BigQuery, assurez-vous que votre environnement Tableau reste performant. Ces outils et fonctionnalités sont là pour vous aider.

Tool/FeatureDescriptionBest Practice
Outil / FonctionnalitéDescriptionles meilleures pratiques
Performance RecorderGet a summary of queries and workbooks and see exactly which queries are running as expected and which are slow.If your queries are slow, revisit your data model to see where you can improve it for efficiency.
Enregistreur de performancesObtenez un résumé des requêtes et des classeurs et voyez exactement quelles requêtes s’exécutent comme prévu et lesquelles sont lentes.Si vos requêtes sont lentes, revoyez votre modèle de données pour voir où vous pouvez l’améliorer pour plus d’efficacité.
Context FiltersContext filters reduce the displayed data to focus only on the information you need.Context filters are ideal when you have a large data source, and it’s best to apply them at the data source level. Any additional filters should then be used at the record level.

For example, if you have a view showing a map of your country with a state/province context filter, you can select a specific state or province and get a view of only that region’s data.
Filtres de contexteLes filtres contextuels réduisent les données affichées pour se concentrer uniquement sur les informations dont vous avez besoin.Les filtres contextuels sont idéaux lorsque vous disposez d’une source de données volumineuse et il est préférable de les appliquer au niveau de la source de données. Tout filtre supplémentaire doit ensuite être utilisé au niveau de l’enregistrement.

Par exemple, si vous avez une vue montrant une carte de votre pays avec un filtre de contexte d’état / province, vous pouvez sélectionner un état ou une province spécifique et afficher uniquement les données de cette région.
Automatic UpdatesWhen automatic updates are turned on, Tableau queries the data source every time you make a change to your data view. This is great when you’re building analytics—you can see dashboards and workbooks take shape in real time. But there are limits to this greatness.Turn off automatic updates when you create dense data views, as automatic updates are actual queries to the data source.
Mises à jour automatiquesLorsque les mises à jour automatiques sont activées, Tableau interroge la source de données chaque fois que vous modifiez votre vue de données. C’est très bien lorsque vous créez des analyses: vous pouvez voir les tableaux de bord et les classeurs prendre forme en temps réel. Mais il y a des limites à cette grandeur.Désactivez les mises à jour automatiques lorsque vous créez des vues de données denses, car les mises à jour automatiques sont de véritables requêtes adressées à la source de données.
Parallel QueriesExecute multiple queries at the same time.If you’re performing parallel queries on large data sets, use custom attributes to add more parameters and further focus the queries.

Remember, add custom attributes to your workbook or data source before you publish them.
Requêtes parallèlesExécutez plusieurs requêtes en même temps.Si vous effectuez des requêtes parallèles sur des ensembles de données volumineux, utilisez des attributs personnalisés pour ajouter plus de paramètres et cibler davantage les requêtes.

N’oubliez pas d’ajouter des attributs personnalisés à votre classeur ou source de données avant de les publier.

In the next unit, take a look at how you can fine tune BigQuery to keep your data moving fast, and see how BigQuery and Tableau come together to help make predictions about business. /Dans l’unité suivante, découvrez comment vous pouvez affiner BigQuery pour que vos données continuent à circuler rapidement, et voyez comment BigQuery et Tableau s’associent pour aider à faire des prédictions sur les activités.

Resources /Ressources

Optimize Google BigQuery Performance /Optimiser les performances de Google BigQuery

Learning Objectives /Objectifs de formation

After completing this unit, you’ll be able to: /Une fois cette unité terminée, vous pourrez :

  • Explain what Google BigQuery is. /Expliquer ce qu’est Google BigQuery.
  • Explain best practices for optimizing data storage and queries in BigQuery. /Expliquer les bonnes pratiques pour optimiser le stockage des données et les requêtes dans BigQuery.
  • Explain how Tableau and Google BigQuery work together with machine learning (ML) to make business predictions. /Expliquer comment Tableau et Google BigQuery fonctionnent avec machine learning (ML) pour effectuer des prédictions commerciales.

Understand the Challenges of Storing Big Data /Comprendre les défis du stockage de Big Data

In the previous unit, you learned about optimizing data queries using Tableau. Let’s take a step back—how are you storing that big data in the first place? Data warehouses have become the common solution for data storage in business, as warehouses integrate and store data from multiple sources, then serve that data up for analytics. /Dans l’unité précédente, vous avez appris à optimiser les requêtes de données à l’aide de Tableau. Prenons un peu de recul. Comment stockez-vous ces données volumineuses en premier lieu? Les entrepôts de données sont devenus la solution courante de stockage de données dans les entreprises, car les entrepôts intègrent et stockent des données provenant de plusieurs sources, puis ces donnés servent à des fins d’analyse.

The next question: Is your storage solution optimized for big data analytics? Many more challenges present themselves. /La question suivante: votre solution de stockage est-elle optimisée pour l’analyse du Big Data? De nombreux autres défis se présentent.

  • It’s very difficult to design, build, maintain, and scale data warehouses for big data. /Il est très difficile de concevoir, construire, maintenir et faire évoluer des entrepôts de données pour le Big Data.
  • Common data warehouses become expensive quickly as you scale. /Les entrepôts de données courants deviennent rapidement coûteux à mesure que vous évoluez.
  • They’re even more expensive if you need high availability. /Ils sont encore plus chers si vous avez besoin d’une haute disponibilité.
  • Some data warehouses struggle with parallel queries. /Certains entrepôts de données ont du mal avec les requêtes parallèles.

And so on. /Etc.

Use Google BigQuery to Solve Big Data Challenges /Utilisez Google BigQuery pour résoudre les défis du Big Data

Conference building with Google Cloud logo on the windowThese are some of the fundamental challenges Google BigQuery answers. It’s a cloud data warehouse, part of the Google Cloud product suite, designed to scale and keep costs low. /Voici quelques-uns des défis fondamentaux auxquels répond Google BigQuery. Il s’agit d’un entrepôt de données dans le cloud, qui fait partie de la suite de produits Google Cloud, conçu pour évoluer et réduire les coûts.

It’s optimized for running Structured Query Language (SQL) queries against massive, structured, and semistructured data sets. Use cases include: /Il est optimisé pour exécuter des requêtes SQL (Structured Query Language) sur des ensembles de données massifs, structurés et semi-structurés. Les cas d’utilisation incluent:

  • Ad hoc analytics /Analyse ad hoc
  • Web logs
  • Machine/server logs
  • Internet of Things (IoT) data sets /Ensembles de données de l’Internet des objets (IoT)
  • Ecommerce customer behavior /Comportement des clients du Ecommerce
  • Mobile app data /Données d’application mobile
  • Retail analytics /Analyse de la vente au détail
  • Gaming telemetry /Télémétrie de jeu
  • Google Analytics Premium data /Données Google Analytics Premium
  • Any data set that’s too large for standard relational database management system queries /Tout ensemble de données trop volumineux pour les requêtes du système de gestion de base de données relationnelle standard

As with Tableau, there are a set of best practices you can use with BigQuery to optimize your storage for analytics, and get the most out of your investment. /Comme avec Tableau, il existe un ensemble de bonnes pratiques que vous pouvez utiliser avec BigQuery pour optimiser votre stockage à des fins d’analyse et tirer le meilleur parti de votre investissement.

Know the Techniques for BigQuery Optimization /Connaître les techniques d’optimisation BigQuery

Best PracticeTechnique
Rely on native tables.With BigQuery, you optimize with iterative querying or by going to the source to get your data and repeating. Avoid using federated tables (creating a local table to represent a foreign or remote table) and instead use the Query API. This ensures high performance when you then use Tableau to query against BigQuery.
Faites confiance aux tables natives.Avec BigQuery, vous optimisez avec des requêtes itératives ou en accédant à la source pour récupérer vos données et les répéter. Évitez d’utiliser des tables fédérées (en créant une table locale pour représenter une table étrangère ou distante) et utilisez plutôt l’API Query. Cela garantit des performances élevées lorsque vous utilisez ensuite Tableau pour interroger BigQuery.
Denormalize your data sets.You denormalize data when you take individual tables and combine them or create copies based on similar or duplicate fields. Denormalizing improves data querying performance. While it does mean you’re repeating and nesting fields and increasing storage needs in the process, the high performance you get with denormalization in BigQuery outweighs this tax.
Dénormalisez vos ensembles de données.Vous dénormalisez les données lorsque vous prenez des tables individuelles et les combinez ou créez des copies basées sur des champs similaires ou dupliqués. La dénormalisation améliore les performances d’interrogation des données. Bien que cela signifie que vous répétez et imbriquez des champs et que vous augmentez les besoins de stockage dans le processus, les performances élevées que vous obtenez avec la dénormalisation dans BigQuery l’emportent sur cette taxe.
Shard your tables by date where you can.Shard refers to the act of dividing a table into smaller partitions. This is especially useful when you have data that supports partition by date, like log data, or any data that is frequently timestamped. This simplifies the data structure and enables you to focus queries by date.

Note, when you query sharded data, use custom SQL in Tableau.
Répartissez vos tableaux par date lorsque vous le pouvez.Shard fait référence à l’action de diviser une table en partitions plus petites. Ceci est particulièrement utile lorsque vous disposez de données qui prennent en charge la partition par date, comme les données de journal ou toute donnée qui est fréquemment horodatée. Cela simplifie la structure des données et vous permet de concentrer les requêtes par date.

Notez que lorsque vous interrogez des données partitionnées, utilisez SQL personnalisé dans Tableau.

When you optimize your data and analytics, special things happen. Managers can make better informed decisions about their business, faster. People in any position of the business can do their job better, with knowledge that they’re making an impact and where they should focus. /Lorsque vous optimisez vos données et vos analyses, des choses spéciales se produisent. Les gestionnaires peuvent prendre des décisions mieux informées concernant leur entreprise, plus rapidement. Les personnes à n’importe quel poste de l’entreprise peuvent mieux faire leur travail, sachant qu’elles ont un impact et sur quoi elles doivent se concentrer.

BigQuery and Tableau can help take analytics even further with machine learning (ML). /BigQuery et Tableau peuvent vous aider à pousser encore plus loin l’analyse grâce au machine learning (ML).

Use Tableau to Visualize Google BigQuery ML Results /Utilisez Tableau pour visualiser les résultats de Google BigQuery ML

Machine learning (ML) refers to the development practice of coding a learning model for a computer and giving it thousands to millions of data points. After the model learns about the information, it can make predictions based off of that data. /L’apprentissage automatique (ML) fait référence à la pratique de développement consistant à coder un modèle d’apprentissage pour un ordinateur et à lui donner des milliers à des millions de points de données. Une fois que le modèle a pris connaissance des informations, il peut effectuer des prédictions basées sur ces données.

ML is famous for such things as swapping the faces of famous people in viral videos, and creating speech when coupled with natural language processing. There are many useful things that businesses can use it for. /ML est célèbre pour des choses telles que l’échange des visages de personnes célèbres dans des vidéos virales et la création de la parole lorsqu’il est associé au traitement du langage naturel. Les entreprises peuvent l’utiliser pour de nombreuses choses utiles.

  • Predicting real estate prices. /Prédire les prix de l’immobilier.
  • Recommending products on a retail site. /Recommander des produits sur un site de vente au détail.
  • Predicting resource needs in areas experiencing poverty around the globe. /Prédire les besoins en ressources dans les zones en situation de pauvreté dans le monde.
  • Advising on sales quotas and business targets. /Conseil sur les quotas de vente et les objectifs commerciaux.

And so on. You can integrate BigQuery ML into your data to train models that can help make business decisions. Then, use Tableau to visualize the results. /Etc. Vous pouvez intégrer BigQuery ML à vos données pour former des modèles qui peuvent vous aider à prendre des décisions commerciales. Ensuite, utilisez Tableau pour visualiser les résultats.

In this case, use Tableau’s native connector whenever possible. This optimizes performance as described in the previous unit. However, you always have the option of using custom SQL if you need to. /Dans ce cas, utilisez le connecteur natif de Tableau autant que possible. Cela optimise les performances comme décrit dans l’unité précédente. Cependant, vous avez toujours la possibilité d’utiliser SQL personnalisé si vous en avez besoin.

Good Data Analytics for Everyone /Une bonne analyse des données pour tous

As you dig into your data and analytics, you might have questions. It’s good to be curious. It’s even better to be able to answer these questions with data at your fingertips. Use these best practices to build an analytics-rich environment everyone at your company can benefit from. /Lorsque vous explorez vos données et vos analyses, vous pourriez avoir des questions. C’est bon d’être curieux. Il est encore mieux de pouvoir répondre à ces questions avec des données à portée de main

Use these best practices to build an analytics-rich environment everyone at your company can benefit from. /Utilisez ces bonnes pratiques pour créer un environnement riche en analyses dont tout le monde dans votre entreprise peut bénéficier.

Resources / Ressources