More

    Analiza i wizualizacja danych z wykorzystaniem Pythona

    Od jakiegoś czasu Python sukcesywnie podbija branżę IT. Jest też coraz bardziej ceniony w świecie wielkich pieniędzy i jeszcze większej ilości danych. Trading i zarządzanie ryzykiem, fundusze hedgingowe, otwarta bankowość czy zarządzanie prywatnymi inwestycjami – to najpopularniejsze przykłady zastosowania tego języka programowania w finansach.

    Mimo że Python jest tak naprawdę starszy niż Java, tak dużym zainteresowaniem jak obecnie cieszy się dopiero od około 2 lat. Głównej przyczyny można upatrywać w rozwoju Data Science. To właśnie dzięki “nauce o danych” Pythona zaczęto wykorzystywać w różnych nowych obszarach – tworzeniu skryptów automatyzujących, web-scrappingu i testowaniu oprogramowania jak i Web Developmencie. Ale jednym z ciekawszych zastosowań może być także analiza danych, do której Python jest wręcz stworzony.

    Analiza danych w Pythonie

    Składnia Pythona pozwala przekształcić właściwie każdą instrukcję matematyczną do kodu. Python “lubi się” z matematyką i dzięki temu doskonale koresponduje z algorytmami finansowymi. Posiada też sporo bibliotek ułatwiających analizę statystyczną. 

    Można w nim zrobić znacznie więcej i łatwiej niż w Excelu, z którego można importować dane do Pythona. I co równie ważne, pozwala na wprowadzanie algorytmów machine learningowych do powiązanych z nim projektów. Dzięki temu stanowi poważną konkurencję dla języków wykorzystywanych w świecie finansów: Javy, C++, C# oraz R.

    Do czego można wykorzystywać Pythona w finansach?

    Pierwszym przykładem może być trading i zarządzanie ryzykiem. Z Pythona korzystają w tym celu takie potęgi, jak JP Morgan Chase. To jeden z największych holdingów finansowych na świecie, który inwestuje w nowe technologie miliardy dolarów. Jednym z takich obszarów jest właśnie w rozwój instrumentów opartych na analizie w Pythonie. Rdzeniem tej działalności jest platforma handlowa Athena. O rozmiarach tego przedsięwzięcia mogą świadczyć liczby związane z migracją Atheny z Pythona 2 fo Pythona 3. Operacja, która rozpoczęła się w 2019 roku, dotyczyła przeniesienia 35 milionów linijek kodu.

    Z możliwości, które stwarza znajomość tego języka, korzystają też coraz częściej analitycy funduszy hedgingowych. Nie programiści, ale specjaliści z innych obszarów, którzy dostrzegli, że dzięki zdobyciu dodatkowych umiejętności i lepszym zrozumieniu algorytmów mogą poprawić też analizy dla spółek. W rezultacie zaczęli się uczyć Pythona, którego uważa się za technologię o stosunkowo niskim progu wejścia.

    Kolejnym przykładem będzie Open Banking, czyli otwarta bankowość, o której zrobiło się głośno jesienią 2019 roku za sprawą unijnej dyrektywy PSD2. Jednym z jej udogodnień jest dostęp do wielu rachunków różnych instytucji, w których trzymamy swoje pieniądze, z jednego konta bankowego. Aby to było możliwe, wspomniana dyrektywa nałożyła na banki obowiązek do podzielenia się swoimi danymi z tzw. fintechami. A te z kolei bardzo często do analizy tych danych korzystają właśnie z Pythona, który ułatwia ich przetwarzanie i tworzenie nowych instrumentów, narzędzi czy nowej oferty.

    I wreszcie analiza prywatnych inwestycji – w której możemy wykorzystać Pythona do zautomatyzowania procesu pobierania danych, np. notowań spółek, zestawiania ich ze sobą i porównania z brenchmarkiem rynkowym. W efekcie zaś wzmocnić wartość naszego portfela inwestycyjnego, a zarobione pieniądze zainwestować np. w rozwój własnych umiejętności.

    Python – z czego warto się doszkolić?

    Chcesz poznać metody analizy i przetwarzania danych z wykorzystaniem najnowocześniejszych rozwiązań stosowanych w Pythonie? Na pewno warto zwrócić uwagę na naukę automatyzacji procesu zbierania i obróbki danych. Naucz się też wyciągania wniosków na podstawie zebranych informacji i prezentowania ich w postaci czytelnych wizualizacji. Podstawy statystyki (operacje na danych w NumPy), zastosowanie biblioteki Pandas (normalizacja i obróbka danych / analiza regresji), wizualizacje danych z Matplotlib, sporządzanie interaktywnych wykresów i dashboardów z Plotly i Cuffilnks.

    Python w rankingach Stack Overflow

    • Według Stack Overflow Python zajmuje 4. miejsce w kategorii najpopularniejszych technologii (wskazało go 44% ankietowanych). Wyżej znalazły się tylko JavaScript, HTML/CSS i SQL
    • 3. miejsce Pythona w zestawieniu najbardziej lubianych języków (66,7%), a wyprzedziły go jedynie Rust i TypeScript. Jednak już w rankingu najbardziej poszukiwanych języków był bezkonkurencyjny i zajął najwyższe miejsce na podium.
    • W rankingu najpopularniejszych bibliotek znajdziemy m.in. Pandas (15,5% – trzecie miejsce), czyli biblioteka napisana do Pythona, służąca analizie danych.

    Adrian Kamiński
    Analityk finansowy i ekspert Data Science w Kodilla.com. Absolwent uczelni ekonomicznej, programista Python, analityk finansowy zajmujący się kontrolingiem finansowym i operacyjnym, wycenami przedsiębiorstw i znaków towarowych oraz doradztwem przy procesach fuzji i przejęć. Prywatnie inwestuje na giełdzie.

    Latest articles

    11 bibliotek, które powinien znać każdy iOS developer

    Przez dwanaście lat, App Store mocno zadomowił się na naszych urządzeniach mobilnych, oferując coraz to większą różnorodność aplikacji. W tym roku ich...

    Jak używać Web Components w Reactcie i Angularze

    Kontynuujemy temat użycia Web Components w budowaniu aplikacji. W tym wpisie przyjrzymy się ich zastosowaniu wraz z popularnymi frameworkami JS-wymi.

    Hacktoberfest – ten hackathon to małe piwo

    Hackathon to wydarzenie programistyczne polegające na zrealizowaniu w określonym czasie projektu zgodnego założeniami organizatora. Większość z was pewnie kojarzy słowo Hackathon. Najczęściej...

    #IThotStory, czyli największe wpadki programistów

    Co prawda programista to nie saper i może pomylić się więcej niż raz, ale każda wpadka niesie za sobą jakieś ryzyko. Zaliczyliście...

    Leave a reply

    Please enter your comment!
    Please enter your name here

    Related articles

    X