More

    Analiza i wizualizacja danych z wykorzystaniem Pythona

    Od jakiegoś czasu Python sukcesywnie podbija branżę IT. Jest też coraz bardziej ceniony w świecie wielkich pieniędzy i jeszcze większej ilości danych. Trading i zarządzanie ryzykiem, fundusze hedgingowe, otwarta bankowość czy zarządzanie prywatnymi inwestycjami – to najpopularniejsze przykłady zastosowania tego języka programowania w finansach.

    Mimo że Python jest tak naprawdę starszy niż Java, tak dużym zainteresowaniem jak obecnie cieszy się dopiero od około 2 lat. Głównej przyczyny można upatrywać w rozwoju Data Science. To właśnie dzięki “nauce o danych” Pythona zaczęto wykorzystywać w różnych nowych obszarach – tworzeniu skryptów automatyzujących, web-scrappingu i testowaniu oprogramowania jak i Web Developmencie. Ale jednym z ciekawszych zastosowań może być także analiza danych, do której Python jest wręcz stworzony.

    Analiza danych w Pythonie

    Składnia Pythona pozwala przekształcić właściwie każdą instrukcję matematyczną do kodu. Python “lubi się” z matematyką i dzięki temu doskonale koresponduje z algorytmami finansowymi. Posiada też sporo bibliotek ułatwiających analizę statystyczną. 

    Można w nim zrobić znacznie więcej i łatwiej niż w Excelu, z którego można importować dane do Pythona. I co równie ważne, pozwala na wprowadzanie algorytmów machine learningowych do powiązanych z nim projektów. Dzięki temu stanowi poważną konkurencję dla języków wykorzystywanych w świecie finansów: Javy, C++, C# oraz R.

    Do czego można wykorzystywać Pythona w finansach?

    Pierwszym przykładem może być trading i zarządzanie ryzykiem. Z Pythona korzystają w tym celu takie potęgi, jak JP Morgan Chase. To jeden z największych holdingów finansowych na świecie, który inwestuje w nowe technologie miliardy dolarów. Jednym z takich obszarów jest właśnie w rozwój instrumentów opartych na analizie w Pythonie. Rdzeniem tej działalności jest platforma handlowa Athena. O rozmiarach tego przedsięwzięcia mogą świadczyć liczby związane z migracją Atheny z Pythona 2 fo Pythona 3. Operacja, która rozpoczęła się w 2019 roku, dotyczyła przeniesienia 35 milionów linijek kodu.

    Z możliwości, które stwarza znajomość tego języka, korzystają też coraz częściej analitycy funduszy hedgingowych. Nie programiści, ale specjaliści z innych obszarów, którzy dostrzegli, że dzięki zdobyciu dodatkowych umiejętności i lepszym zrozumieniu algorytmów mogą poprawić też analizy dla spółek. W rezultacie zaczęli się uczyć Pythona, którego uważa się za technologię o stosunkowo niskim progu wejścia.

    Kolejnym przykładem będzie Open Banking, czyli otwarta bankowość, o której zrobiło się głośno jesienią 2019 roku za sprawą unijnej dyrektywy PSD2. Jednym z jej udogodnień jest dostęp do wielu rachunków różnych instytucji, w których trzymamy swoje pieniądze, z jednego konta bankowego. Aby to było możliwe, wspomniana dyrektywa nałożyła na banki obowiązek do podzielenia się swoimi danymi z tzw. fintechami. A te z kolei bardzo często do analizy tych danych korzystają właśnie z Pythona, który ułatwia ich przetwarzanie i tworzenie nowych instrumentów, narzędzi czy nowej oferty.

    I wreszcie analiza prywatnych inwestycji – w której możemy wykorzystać Pythona do zautomatyzowania procesu pobierania danych, np. notowań spółek, zestawiania ich ze sobą i porównania z brenchmarkiem rynkowym. W efekcie zaś wzmocnić wartość naszego portfela inwestycyjnego, a zarobione pieniądze zainwestować np. w rozwój własnych umiejętności.

    Python – z czego warto się doszkolić?

    Chcesz poznać metody analizy i przetwarzania danych z wykorzystaniem najnowocześniejszych rozwiązań stosowanych w Pythonie? Na pewno warto zwrócić uwagę na naukę automatyzacji procesu zbierania i obróbki danych. Naucz się też wyciągania wniosków na podstawie zebranych informacji i prezentowania ich w postaci czytelnych wizualizacji. Podstawy statystyki (operacje na danych w NumPy), zastosowanie biblioteki Pandas (normalizacja i obróbka danych / analiza regresji), wizualizacje danych z Matplotlib, sporządzanie interaktywnych wykresów i dashboardów z Plotly i Cuffilnks.

    Python w rankingach Stack Overflow

    • Według Stack Overflow Python zajmuje 4. miejsce w kategorii najpopularniejszych technologii (wskazało go 44% ankietowanych). Wyżej znalazły się tylko JavaScript, HTML/CSS i SQL
    • 3. miejsce Pythona w zestawieniu najbardziej lubianych języków (66,7%), a wyprzedziły go jedynie Rust i TypeScript. Jednak już w rankingu najbardziej poszukiwanych języków był bezkonkurencyjny i zajął najwyższe miejsce na podium.
    • W rankingu najpopularniejszych bibliotek znajdziemy m.in. Pandas (15,5% – trzecie miejsce), czyli biblioteka napisana do Pythona, służąca analizie danych.

    Adrian Kamiński
    Analityk finansowy i ekspert Data Science w Kodilla.com. Absolwent uczelni ekonomicznej, programista Python, analityk finansowy zajmujący się kontrolingiem finansowym i operacyjnym, wycenami przedsiębiorstw i znaków towarowych oraz doradztwem przy procesach fuzji i przejęć. Prywatnie inwestuje na giełdzie.

    Latest articles

    Automatyzacja z Pythonem – pobieranie kolekcji filmów z YouTube

    Automatyzacja czynności, które są czasochłonne, to według mnie największa zaleta nauki programowania. Często zadania wymagające od nas klikania, czekania i przepisywania captchy...

    Programowanie funkcyjne w JS

    Jeśli bierzesz udział w rozmowach rekrutacyjnych na stanowisko regular lub senior developera, to pewnie niejednokrotnie miałeś lub miałaś do czynienia z takimi...

    Własny plugin do Figmy w React.js

    Jeśli udało Ci się kiedykolwiek pracować z Figmą, istnieje spora szansa, że narzędzie przypadło Ci do gustu. Tak przynajmniej było w moim...

    Wykorzystanie Virtual DOM na przykładzie Reacta

    Virtual DOM to bardzo popularne rozwiązanie znane z Reacta. Co to dokładnie jest? W jaki sposób działa w Reactcie? O tym opowie...

    Leave a reply

    Please enter your comment!
    Please enter your name here

    Related articles

    X