Fspacex est une plateforme de traitement et d'analyse de données con?ue sur l'architecture distribuée Hadoop
Introduction à la plateforme
Fspacex est une plateforme de traitement et d'analyse de données conçue sur l'architecture distribuée Hadoop. La plate - forme peut fournir des fonctionnalités basées sur l'acquisition et le stockage de données hétérogènes multi - sources, le nettoyage et le filtrage de données, la construction d'entrepôts de données, l'application d'algorithmes Multi - types, la visualisation analytique intégrée, etc. pour résoudre les problèmes d'application de données de tous les segments du cycle de vie complet du produit, du client à la fabrication, afin d'améliorer la rentabilité économique et la compétitivité de l'entreprise.
Force Control Technology dispose d'une équipe professionnelle d'applications Big Data pour fournir aux utilisateurs une analyse complète des besoins métier, analyser les applications métier, l'acquisition de données, le stockage de données, le traitement des données, l'exploration analytique et la planification visuelle des solutions, clarifier les objectifs de construction, définir les principes de construction, élaborer des solutions de construction, et développer, tester et déployer la plate - forme. Utiliser les données et combiner les points douloureux de production pour apprendre en permanence à évoluer, améliorer les modèles de décision et optimiser les recommandations de décision.

Architecture de la plateforme
L'architecture globale de la plateforme industrielle Big Data est divisée en trois couches: Data Factory, Algorithm Engine et Data Visualization.
L'usine de données réalise principalement l'acquisition, l'audit et le stockage de données hétérogènes, et l'acquisition de données peut réaliser la fusion sur de nombreuses bases de données hétérogènes basées sur des passerelles de communication industrielles, des bases de données en temps réel, des bases de données commerciales relationnelles et d'autres; L'audit des données consiste principalement à vérifier les données reçues, à vérifier leur disponibilité, leur valeur nulle, leur type et leur exactitude; Stockage de données avec hbase, greenplum, redis et d'autres applications combinées de base de données pour le stockage et l'analyse de données, créez des architectures de stockage distribuées qui augmentent dynamiquement les nœuds de stockage avec des fonctionnalités telles que l'évolutivité, la réplication multiple, la tolérance aux erreurs élevée et le débit élevé.
Le moteur algorithmique fournit le Framework de calcul distribué Spark qui permet une utilisation efficace des ressources basée sur un Cluster Hadoop, permettant le calcul en temps réel des données et l'exploration analytique de données massives. Prend en charge la Bibliothèque d'apprentissage automatique mlib, prend en charge les algorithmes d'apprentissage des notifications et les classes d'outils, y compris la classification, le Clustering, le Filtrage collaboratif, la réduction de dimension.
La visualisation de données fournit des fonctions de modélisation telles que des ensembles de données, des composants d'ensembles de valeurs dynamiques et statiques, le filtrage des données, la conversion de formats de données et d'autres fonctions telles que les opérations de glissement, les diagrammes enrichis, la liaison de diagrammes, le forage ascendant et descendant, la typographie personnalisée, le courrier temporel, les SIG et l'intégration multimédia.

Caractéristiques de la plateforme
-
Des données hétérogènes sont accessibles, y compris des données telles que des séquences, des images, des fichiers, etc.
-
Nettoyage de données, offrant une grande diversité de capacités de nettoyage et de traitement des données.
-
Archivage de données pour construire des entrepôts de données d'entreprise et des solutions de stockage basées sur le Big Data.
-
Un modèle algorithmique d’intelligence artificielle qui fournit des algorithmes intelligents (Machine Learning, génétique, etc.) orientés vers l’optimisation de la planification de la production.
-
Enrichissez les composants de diagramme pour une analyse multidimensionnelle flexible avec des outils de visualisation.
-
Programme de déploiement privatisé pour garantir la sécurité et la fiabilité des actifs de données de base au sein de l'entreprise.