Hamparan ialah "perkara gelap perisian perniagaan": ia ada di mana-mana, ia tidak kelihatan dan ia menyatukan segala-galanya. Perniagaan dan kewangan dijalankan pada hamparan; tiada alat perisian lain telah memperkasakan begitu ramai orang untuk membina penyelesaian kepada begitu banyak masalah yang berbeza. Dalam konteks ini, anda perlu memahami sebarang penegasan bahawa "Jupyter ialah Excel baharu" sebagai sensasi yang sengaja.
Namun, buku nota Jupyter berkongsi beberapa persamaan utama dengan hamparan Excel. Buku nota terdapat di mana-mana dalam pengkomputeran saintifik dan statistik, dengan cara yang sama seperti hamparan mendominasi operasi perniagaan dan kewangan pejabat hadapan. Dalam siaran ini, kami akan meneroka beberapa persamaan dan perbezaan falsafah dan praktikal antara kedua-dua alatan dalam usaha untuk menjelaskan sebab kedua-duanya mempunyai peminat dan pengkritik yang begitu bersemangat.
persamaan: yang positif
- Secara luar biasa, kedua-dua buku nota Jupyter dan hamparan Excel menggunakan "sel" sebagai metafora visual untuk memecahkan analisis kepada langkah-langkah diskret. Sel dalam kedua-dua format mengandungi kod dan menunjukkan hasil.
- Kedua-duanya direka untuk analisis interaktif, berulang, penerokaan, menggabungkan pengiraan dengan visualisasi data.
- Kedua-duanya bertujuan untuk mempunyai keluk pembelajaran yang cetek untuk pemula.
- Kedua-duanya direka bentuk untuk serba lengkap dan mudah dikongsi. Persekitaran dalam talian seperti Google Colab dan JupyterHub menghilangkan proses persediaan Python yang sering rumit.
- Kedua-duanya mempunyai pegangan yang kuat terhadap pendidikan tinggi dalam bidang masing-masing. Sekolah perniagaan hampir secara universal mengajar pemodelan kewangan dengan Excel, dan jabatan STEM biasanya mengajar analisis data dengan buku nota Jupyter1. Graduan baharu membawa kebiasaan mereka dengan alatan ini ke tempat kerja.
persamaan: negatif
Kedua-dua hamparan Excel dan buku nota Jupyter dikritik oleh jurutera perisian sebagai bukan "perisian sebenar". Selain daripada had yang jelas bahawa kedua-dua artifak memerlukan program lain untuk dijalankan, ia juga menyukarkan untuk mematuhi amalan terbaik kejuruteraan perisian:
- Sebagai fail monolitik yang besar, ia sukar untuk mengawal versi dengan alatan pembangun seperti git. Dokumen Office OpenXML dizip, yang "mencakar" kandungan fail supaya git tidak dapat menjejaki perubahan pada data asas. Buku nota Jupyter sebenarnya hanyalah fail JSON yang besar, tetapi output sel dan perubahan kiraan pelaksanaan memperkenalkan delta berlebihan2.
- Kedua-dua hamparan Excel dan buku nota Jupyter sukar untuk dihasilkan, walaupun kedua-dua alatan digunakan dalam pengeluaran secara praktikal. Excel dan Jupyter ialah persekitaran pelaksanaan berat yang memperkenalkan kebergantungan mereka sendiri dan kelihatan membazir kepada jurutera yang biasa menulis skrip kendiri.
- Kedua-duanya rawan dan sukar untuk diuji. Hakikat bahawa kedua-dua platform memenuhi keperluan pengguna yang kurang pengalaman menulis kod memberikan mereka reputasi untuk mencipta penyelesaian yang penuh dengan pepijat. Pada hakikatnya, mungkin saja, tanpa alat seperti ujian unit atau budaya kawalan kualiti, pepijat dalam hamparan dan buku nota lebih berkemungkinan menjadikannya sebagai pengeluaran.
perbezaan
- Excel memudahkan bukan pengaturcara memahami cara data mengalir antara sel.
- Grid Excel menyediakan cara semula jadi untuk merujuk data melalui koordinat sel, manakala Jupyter bergantung pada pembolehubah yang dinamakan, memaksa pengguna untuk menghadapi realiti bahawa penamaan pembolehubah adalah sukar.
- Lebih mudah untuk memeriksa hasil perantaraan pengiraan berbilang langkah dalam Excel kerana sel berada betul-betul di hadapan anda. Cetak pernyataan dalam buku nota Jupyter memerlukan lebih banyak usaha untuk menyediakan dan melaksanakan.
- Excel adalah serba lengkap; Nilai Jupyter terletak pada ekosistem pakej Python.
- Pergantungan Python pada perpustakaan luaran memudahkan jabatan IT menyekat penggunaan Jupyter.
- Kedua-dua memasang Jupyter secara setempat dan menjalankan buku nota melalui rangkaian memerlukan lebih banyak persediaan daripada membuka Excel.
- Kebanyakan hamparan Excel hanya menggunakan fungsi yang dihantar bersama Excel, yang bermaksud bahawa kenalan perniagaan hanya boleh membuka model anda, mengubah suainya dan menjalankannya. Buku nota sukar dikongsi di luar organisasi, malah dalam satu organisasi, kerana ia sangat terikat dengan persekitaran Python tertentu dan persekitaran Python sukar untuk disediakan.
- Excel boleh berfungsi sebagai "pangkalan data orang miskin", menyimpan data jadual merentas berbilang helaian dan menyediakan keupayaan seperti OLAP melalui Jadual Pangsi. Buku nota Jupyter biasanya memuatkan data daripada API atau lokasi fail kongsi, sebab lain mengapa ia tidak serba lengkap.
- "Memalsukan nombor" lebih mudah dalam Excel berbanding Jupyter. Kemas kini hamparan dalam masa nyata tanpa perlu menjalankan semula kod atau menyediakan widget interaktif. Perubahan sekali sahaja lebih mudah dibuat, yang penting apabila kelajuan adalah perkara utama.
- Bekerja dengan kod tidak dapat dielakkan dalam Jupyter, tetapi Excel boleh digunakan sepenuhnya melalui GUI: malah terdapat menu untuk memilih fungsi dalam formula sel.
- Jupyter lebih terbuka dan fleksibel, tetapi ia memerlukan lebih banyak pengetahuan teknikal untuk digunakan dengan berkesan.
- Jupyter mempunyai penekanan yang lebih kuat pada naratif dan penceritaan berbanding Excel.
- Buku nota Jupyter direka untuk pengaturcaraan celik, di mana kod dan prosa diselang-seli untuk mencipta aliran naratif.
- Pelaporan dan pembentangan dalam Excel biasanya bergantung pada sama ada salin/tampal atau penyepaduan dengan PowerPoint.
implikasi
Usaha Microsoft untuk menyepadukan Python ke dalam Excel tidak akan menghakis penguasaan Jupyter dalam pengkomputeran saintifik dan teknikal dengan ketara. Hamparan tidak mempunyai struktur naratif semula jadi, yang menjadikannya kurang sesuai untuk pendidikan dan penyelidikan yang boleh diterbitkan semula. Selain itu, komuniti "sains terbuka" tidak akan menggunakan alat sumber tertutup yang dibina oleh gergasi teknologi Amerika.
Alat dan "amalan terbaik" akan muncul untuk mengurangkan kelemahan operasi buku nota Jupyter3, sama seperti yang ada pada hamparan. Kebanyakan pengguna pejabat hadapan akan mengabaikan garis panduan sedemikian4, menimbulkan ketegangan berterusan dengan jabatan IT. Setelah menyaksikan bagaimana keadaan berlaku dengan Excel, banyak jabatan IT melihat menyokong Jupyter seperti membuka kotak kelemahan keselamatan dan sakit kepala penyelenggaraan Pandora.
Kedua-dua platform akan bertahan pada masa hadapan yang boleh dijangka. Kedua-duanya tidak akan menggantikan yang lain kerana mereka menyasarkan pangkalan pengguna dengan set kemahiran yang berbeza secara asasnya. Orang yang bekerja di persimpangan pemodelan kuantitatif dan membuat keputusan perniagaan akan terus memerlukan kebiasaan dengan kedua-dua alatan.
kesimpulan
Gunakan alat yang paling sesuai dengan budaya organisasi tempat anda menyelesaikan masalah. Terdapat situasi di mana keperluan teknikal akan memaksa anda menggunakan satu alat berbanding yang lain, sama seperti terdapat organisasi yang hanya membenarkan anda menggunakan satu alat atau yang lain. Jika anda bekerja dalam bidang yang dikuasai Excel dan memerlukan keupayaan Python, menurut pengalaman saya, lebih mudah untuk membaca dan menulis hamparan Excel daripada kod Python daripada meminta pengguna Excel membuka buku nota Jupyter.
Jurutera perisian dan jabatan IT di seluruh dunia akan terus memandang rendah pada buku nota Jupyter, sama seperti yang mereka lakukan dengan hamparan selama beberapa dekad. Hakikat bahawa jenis MBA tidak menggunakan komputer riba Jupyter memudahkan IT untuk menguatkuasakan sekatan kejam terhadap penggunaannya. Ironinya, ramai pengguna pejabat hadapan hanya boleh mendapat akses kepada Python sebaik sahaja Microsoft selesai menyepadukannya ke dalam Excel.
-
Sesetengah penahanan masih menggunakan MATLAB, R, SPSS atau SAS, tetapi yuran pelesenan yang tinggi akan terus mendorong pengguna ke arah alternatif percuma dan sumber terbuka dari semasa ke semasa. Merebut pasaran pendidikan ialah bahagian penting dalam strategi perniagaan untuk firma seperti MathWorks, tetapi tidak mungkin mereka akan bertahan selama-lamanya. ↩
-
Alat seperti nbdime boleh membantu dengan kawalan versi untuk buku nota Jupyter, tetapi menggunakannya menambah satu lagi lapisan kerumitan. ↩
-
Alat seperti kilang kertas bertujuan untuk menyelaraskan buku nota yang sedang berjalan dalam persekitaran pengeluaran. Pembekal awan juga menyokong penciptaan saluran paip yang melibatkan komputer riba Jupyter dalam pengeluaran. ↩
-
Berapa ramai yang pernah mendengar tentang standard FAST untuk membina hamparan? ↩
Atas ialah kandungan terperinci Buku Nota Jupyter Seperti Hamparan. Belajar Kedua-duanya.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!