communauté Apprendre Bibliothèque d'outils Loisirs

Français

Maison > base de données > tutoriel mysql > Comment répliquer la fonction `row_number()` de SQL à l'aide d'un Spark RDD ?

Comment répliquer la fonction `row_number()` de SQL à l'aide d'un Spark RDD ?

DDD

Libérer： 2024-12-23 00:07:13

original

765 Les gens l'ont consulté

How to replicate SQL's `row_number()` function using a Spark RDD?

Comment répliquer le row_number() de SQL pour un Spark RDD ?

En SQL, la fonction row_number() attribue un numéro de ligne unique à chaque enregistrement d'une table, partitionné par un ensemble donné de colonnes et ordonné par un autre ensemble. La réplication de cette fonctionnalité pour un Spark RDD peut être effectuée en suivant les étapes suivantes :

1. Créez un PairRDD de paires clé-valeur

Convertissez le RDD des tuples (K, V) en un PairRDD de (K, (V, 1)) paires. Cela permettra d'appliquer le tri en fonction à la fois de la clé K et de la valeur d'espace réservé 1.

2. Triez le RDD

Utilisez sortByKey() pour trier le PairRDD en fonction de la clé K. Cela regroupera tous les enregistrements avec la même clé.

3. Zip With Index

Appelez zipWithIndex() sur le RDD trié pour ajouter une colonne supplémentaire représentant le numéro de ligne dans chaque partition de clé.

4. Combinez la clé, les valeurs et les numéros de ligne

Extrayez la clé, les valeurs et les numéros de ligne du PairRDD à l'aide d'une fonction de mappage et combinez-les dans un nouveau tuple (K, V, rowNum).

Ce processus vous permet d'attribuer des numéros de ligne à chaque enregistrement du RDD, reproduisant ainsi efficacement la fonctionnalité de la fonction row_number() de SQL avec partitionnement.

Exemple :

val temp1 = sc.parallelize(Seq(((3,4),5,5,5),((3,4),5,5,9),((3,4),7,5,5),((1,2),1,2,3),((1,2),1,4,7),((1,2),2,2,3)))

val temp2 = temp1
  .map(x => (x, 1))
  .sortByKey()
  .zipWithIndex()
  .map(a => (a._1._1, a._1._2._1, a._1._2._2, a._1._2._3, a._2 + 1))

temp2.collect().foreach(println)

Copier après la connexion

Sortie :

((1,2),1,2,3,2)
((1,2),1,4,7,1)
((1,2),2,2,3,3)
((3,4),5,5,5,4)
((3,4),5,5,9,5)
((3,4),7,5,5,6)

Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source：php.cn

Article précédent：Comprendre la différence entre WHERE et HAVING en SQL Article suivant：Comment générer efficacement du XML de colonnes de table mises à jour dans SQL Server ?

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Pourquoi mon bouton Afficher/Masquer nécessite-t-il un double-clic dès la première tentative ?

2024-12-23 16:00:19
Comment puis-je ajouter correctement des jours à une variable de date en PHP ?

2024-12-23 15:59:11
Comment C peut-il générer des nombres vraiment aléatoires ?

2024-12-23 15:58:09
Comment puis-je convertir des données Latin1 en UTF-8 dans une table MySQL UTF-8 ?

2024-12-23 15:57:17
Un destructeur virtuel pur en C devrait-il être implémenté ?

2024-12-23 15:56:11
Pourquoi JavaScript ne peut-il pas accéder aux Iframes d'origine croisée et comment puis-je contourner ce problème ?

2024-12-23 15:55:16
Comment masquer la zone de saisie numérique HTML5 ?

2024-12-23 15:54:11
Comment récupérer des valeurs POST avec le type de contenu « application/json » en PHP ?

2024-12-23 15:53:15
Comment implémenter une clé étrangère composite dans MySQL ?

2024-12-23 15:52:10
Pourquoi l'utilisation de la mémoire de mon programme Go dépasse-t-elle le profil de tas signalé par « go tool pprof » ?

2024-12-23 15:51:11

Derniers numéros

function_exists() ne peut pas déterminer la fonction personnalisée Function test () {return true;} if (function_exists ('test')) {echo "le test est une ...

Depuis 2024-04-29 11:01:01

0

3

2273

Comment afficher la version mobile de Google Chrome Bonjour professeur, comment puis-je changer Google Chrome en version mobile ?

Depuis 2024-04-23 00:22:19

0

11

2407

La fenêtre enfant exploite la fenêtre parent, mais la sortie ne répond pas. Les deux premières phrases sont exécutables, mais la dernière ne peut pas être implémentée...

Depuis 2024-04-19 15:37:47

0

1

2020

Il n'y a aucune sortie dans la fenêtre parent document.onclick = function(){ window.opener.document.write('Je suis la sortie de la fenêt...

Depuis 2024-04-18 23:52:34

0

1

1909

Où sont les didacticiels sur la cartographie mentale CSS ? Didacticiel

Depuis 2024-04-16 10:10:18

0

0

1979

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal