Μάθετε Αναλύσεις δεδομένων στο Bash
März 10, 2023Τους τελευταίους μήνες δούλεψα πολύ σκληρά για να δημιουργήσω ένα εισαγωγικό μάθημα κωδικοποίησης δεδομένων για όσους είναι νέοι στην Επιστήμη των Δεδομένων. Επέλεξα το bash (γνωστό και ως γραμμή εντολών) ως την πρώτη γλώσσα δεδομένων που θα σας δείξω, γιατί το βρίσκω εύκολο στην ερμηνεία – ακόμη και για τα πρώτα χρονόμετρα. Στα άρθρα μου ξεκίνησα την „ιστορία“ από την αρχή, οπότε αν δεν έχετε αγγίξει ποτέ ξανά την κωδικοποίηση/προγραμματισμό, μην ανησυχείτε. θα καταλάβετε τα πάντα. Η κύρια εστίασή μου ήταν να διατηρώ τα πάντα εύκολα στην παρακολούθηση, αλλά και πρακτικά και πρακτικά.
Αν διαβάσετε αυτά τα 7 άρθρα, θα μάθετε πώς να κάνετε βασικό καθαρισμό δεδομένων, μορφοποίηση δεδομένων και αναλύσεις μέσω της γραμμής εντολών. Επιπλέον, θα έχετε τον δικό σας διακομιστή δεδομένων για εξάσκηση – θα το χρησιμοποιήσουμε όχι μόνο εδώ, αλλά και στα μελλοντικά μου σεμινάρια SQL και Python.
Σημείωση: εάν είστε νέοι στην επιστήμη δεδομένων, διαβάστε πρώτα τα βασικά στοιχεία της ανάλυσης δεδομένων!
Εδώ είναι τα 7 άρθρα!
Χρειάζεστε πρώτα ένα δωρεάν φύλλο εξαπάτησης Bash;

Αποκτήστε το δωρεάν φύλλο Bash Cheatσυν:
- Φύλλο εξαπάτησης SQL
- Το φύλλο εξαπάτησης της Python
- Πώς να γίνετε επιστήμονας δεδομένων; (50 λεπτά δωρεάν μάθημα βίντεο)
- Σταγόνα ηλεκτρονικού ταχυδρομείου 6 μηνών (που σας καθοδηγεί τα πάντα βήμα προς βήμα)
- κι αλλα…
Στην ενότητα μου ΔΩΡΕΑΝ ΥΛΙΚΑ. Εδώ.
Το βήμα 0 δημιουργεί το περιβάλλον δεδομένων σας. Σε αυτό το σεμινάριο θα σας δείξω πώς να το κάνετε αυτό βήμα προς βήμα – και ως αποτέλεσμα θα έχετε τη δική σας υποδομή δεδομένων με bash, python, R και SQL. Επιπλέον, θα έχετε πρόσβαση σε διάσημα εργαλεία όπως iPython, Jupyter, RStudioκαι pgadmin4. Όλα αυτά είναι δωρεάν. ΔΙΑΒΑΣΤΕ>>
Το πρώτο από τα εκπαιδευτικά μου προγράμματα ειδικά για το bash καλύπτει τις βασικές εντολές „προσανατολισμού“ (πώς να δημιουργείτε καταλόγους, πώς να αλλάζετε καταλόγους, πώς να μετακινείτε αρχεία, πώς να κατεβάζετε αρχεία κ.λπ.), ορισμένα βασικά εργαλεία δειγματοληψίας δεδομένων (όπως το κεφάλι και ουρά) και το εργαλείο μέτρησης λέξεων. ΔΙΑΒΑΣΤΕ>>
Στο δεύτερο επεισόδιο εισάγω 3 κύριες έννοιες στη γραμμή εντολών: επιλογές, σωλήνας και εκτύπωση σε αρχείο. Θα σας δείξω επίσης την εντολή grep, η οποία είναι ένα ευρέως χρησιμοποιούμενο εργαλείο φίλτρου στο bash. ΔΙΑΒΑΣΤΕ>>
Αυτό το κεφάλαιο πλησιάζει πιο κοντά στα εφαρμοσμένα στατιστικά στοιχεία καθώς εκτελούμε τους δικούς μας υπολογισμούς διάμεσων, μέγιστων και ελάχιστων σε ένα αρχείο δεδομένων 7 εκατομμυρίων+ σειρών. Τα εργαλεία που θα μάθουμε για αυτό είναι η ταξινόμηση και οι μοναδικές εντολές! ΔΙΑΒΑΣΤΕ>>
Εδώ θα σας δείξω μερικές βέλτιστες πρακτικές για να επιταχύνετε την καθημερινή σας εργασία στη γραμμή εντολών. 9 κόλπα – και αν δεν σας αρέσει να διαβάζετε, είμαι στην ευχάριστη θέση να σας πω ότι αυτό ήταν το πρώτο μου άρθρο που συνοδεύτηκε επίσης με ένα πλήρες εκπαιδευτικό βίντεο. (Βρείτε το στο άρθρο.) ΔΙΑΒΑΣΤΕ>>
Το επόμενο βήμα του bash είναι να μάθετε τις ροές ελέγχου, όπως εντολές if-then-else και βρόχους while. Θα τα τοποθετήσετε σε σενάρια και στη διαδρομή θα μάθετε πώς να χρησιμοποιείτε και μεταβλητές bash. Επιπλέον, θα σας δείξω ένα μικρό σενάριο για να κοροϊδεύετε τους φίλους σας με ψεύτικο κωδικό πρόσβασης wifi… ΔΙΑΒΑΣΤΕ>>
Σε αυτό το επεισόδιο κλεισίματος θα σας δώσω μια σύντομη εισαγωγή σε 4 ακόμη εργαλεία γραμμής εντολών: sed, awk, join και date. Όλα αυτά θα σας βοηθήσουν να μορφοποιήσετε και να καθαρίσετε τα δεδομένα σας για να είστε πιο ευέλικτοι στα έργα επιστήμης/αναλυτικών δεδομένων σας στο μέλλον! ΔΙΑΒΑΣΤΕ>>
**********
Μέχρι το τέλος αυτής της σειράς θα είστε έτοιμοι να ξεκινήσετε το δικό σας έργο για κατοικίδια και να βελτιώσετε τις δεξιότητές σας μέσω της εκμάθησης-από-πράξης!
Ελέγξτε επίσης τα σεμινάρια Python και SQL!
Στην υγειά σας,
Master Tommy