Course Description: This course is an introduction level course to data analsis, specialized on business processes and real life cases.
This course will uncover you of the information analytics hones executed in the business globe. We will investigate such magic ranges Concerning illustration the explanatory process, how information will be created, stored, accessed, what’s more entryway the association meets expectations with information and makes nature’s turf in which analytics could prosper. The thing that you take in this span will provide for you An solid framework On the whole those territories that backing analytics What’s more will assistance you on preferred position yourself to victory inside your association. You’ll create abilities What’s more An viewpoint that will settle on you All the more profitable speedier Also permit you should turned a profitable advantage should your association. This span additionally gives a support for setting off deeper under propelled investigative Furthermore computational methods, which you bring a chance to investigate On future courses of the information Analytics for benefits of the business specialization.
This course is outlined with have wide bid over Numerous sorts from claiming learners. Anybody who is looking should get an Comprehension about how benefits of the business analytics is really performed for genuine associations will profit. This course will be essential pointed toward experts who have a bachelor’s degree or A percentage introduction of the benefits of the business reality. The individuals for specialized foul degrees or a greater amount propelled business degrees like a mba will discover certain ranges simpler will absorb, What’s more might get most extreme esteem from those span. However, Indeed undergraduates to non-technical fields or propelled high-school people seeking after internships will have the capacity on take after mossycup oak ideas Also get quality from the span. Finally, Significantly experts who bring required profound encounters over systems will inclined discover esteem in this course.
Course Objective:
1. Understanding of real life cases about data
2. Understanding of real life data related problems
3. Understanding of data analysis methodologies
4. Understanding of some basic data operations like: preprocessing, transformation or manipulation
5. Understanding of new technologies like bigdata, nosql, cloud computing
6. Ability to use some trending software in the industry
7. Introduction to data related problems and their applications
Method:
List of course software:
· Excel,
· KNIME,
· RapidMiner
· MS-SQL, SSAS, SSIS
· Oracle Database, ODI, BI
· Apache Cassandra
This course is following hands on experience in all the steps. So attendance with laptop computers is necessary. Also the software list above, will be provided during the course and the list is subject to updates.
Grading
Reading, Attendence and Discussions: 30%
Homeworks: 30%
Project: 40%
Course Content:
Week 1: Introduction to Data, Problems and Real World Examples:
Homework #1 (Due Date: Nov. 23, 2017) : Download the data set of customers (click to download). In the data set you can see, each record is holding the salary and age of the customer and their action in the store (buy: they buy a product, notbuy: they don’t buy any product). Create your own Knime data flow and predict the salary of people below:
Salary
Age
51
22
33
Write a brief explanation for your submission (which algorithm did you use, what are the results you have achieved and how)
Analytical Problems and Analysis
Business Model, conceptualization and frameworks
Information – Action Value Chain
Data Capturing and data sources: Thinking in Data
Analytical Technologies: Data Storage
Analytical Technologies: Big Data, Cloud and Evolution of Web
Analytical Technologies: Relational Databases
Analytical Technologies: Virtualization, In Memory and NoSQL
Analytical Technologies: Introduction to SQL: Simple Queries
Analytical Technologies: SQL – 2: Multiple Tables, Sub Queries
Data Mining and Data Science Basics 1: Classification Problems
Data Mining and Data Science Basics 2: Regression and Prediction
Project proposal will include : Project idea and the data briefly and if you want to go within a group or not and if it is a group than provide the names and ids of group members (2 paragraphs), will be sent to the course email until next week 1stof december.
Deliverables (21stof December) : Knime workflow, report (including your approach and solution together with project definition and data description), presentation
Presentations will be about 5 – 10 minutes (22ndof December): Explain your problem, describe your data set and demonstration of your solution and benefits , from the business approach. (in minimum 3 slides and a knime workflow (of course working)).
Ders İçeriği:
Veri odaklı programlama dersinin 3 farklı seviyeden öğrencilere hitap etmesi beklenmektedir. Henüz programlama ile yeni tanışan kişiler, programlama hakkında bilgisi olan ama çok fazla tecrübesi ve uzmanlığı olmayan kişiler ve progralama konusunda tecrübeli ve uzman ancak veri odaklı progralmama konusuna yeni olan katılımcılar.
Dersin amacı, programlama bilgisi olmayan kişilerin programlama dilleri ile ilk kez karşılaşacağı ve kodlamanın temellerini öğreneceği ve sonrasında veri odaklı program yazabileceği geçişi sağlamaktır.
Programlama geçmişi olan kişilere ise daha çok veri temelli program yazabilecekleri, veri analizinde karşılaşacakları problemlere karşılık gelen uçtan uca problem çözümlerini geliştirebilecekleri programlama yeteneklerini öğretmektir.
Ders kapsamında Python programlama dili öğretilecek olup, dilin temellerinin yanında veri analizine yönelik olarak, python dili içerisinde bulunan bazı kütüphaneler aşağıdaki şekildedir:
· NumPy
· SciPy
· Pandas
· Matplotlib
· Scikit-learn
Ayrıca güncel konulara da yer verilecek ve örneğin derin öğrenme gibi konular için de tensor flow benzeri kütüphanelere giriş yapılacaktır.
Dersin amacı, katılımcıları, veri bilimi, veri analitiği ve iş analitiği dünyasında kullanılan temel teknolojileri, algoritmaları ve görselleştirme / analiz araçlarını temel düzeyde kullanacak seviyeye getirmektir.
Kaynak Kitaplar
Python for Data Analysis, 2nd Edition Data Wrangling with Pandas, NumPy, and IPython, William McKinney, 2017
Learning scikit-learn: Machine Learning in Python Paperback – November 25, 2013, Raúl Garreta, Guillermo Moncecchi
Building Machine Learning Systems with Python , Willi Richert, Luis Pedro Coelho , 2013
Ders boyunca öğrencilere okumaları gereken bazı ufak vaka çalışmaları ile makaleler verilecektir.
Derse Katılım:
Ders boyunca öğrencilere okumaları gereken bazı ufak vaka çalışmaları ile makaleler verilecektir.
Derse Katılım:
Ders 3 modülden oluşmaktadır.
1. Programlamaya giriş (hiç bilmeyenler için)
2. Makine öğrenmesi ve veri analitiğine giriş
3. İleri veri analitiği yöntemleri
Katılımcılar, farklı bilgi düzeylerinden geldikleri için ilk modüle katılım zorunlu olmamakla birlikte verilen bütün ödev ve projelerin yapılması zorunludur. Sadece 3 hafta sürecek, ilk modül için benimle görüşerek öncesinde izin alabilir ve ödev/projeleri yaparak ilk modülden muaf sayılabilirler. Bunun dışında, derse katılım zorunlu olup, özel durumlar için önceden haberleşilerek izin alınabilir. Dersleri kaçırma veya tekrar çalışma ihtimallerine karşı, ders boyunca dijital içerik oluşturularak öğrencilerle azami seviyede paylaşılmaya çalışılacaktır. Derste yapılacaklar:
• Yapısal programlamaya (structural programming) giriş : temel programlama teknikleri, değişken, döngü, koşullar ve fonksiyon gibi temel kavramlara giriş ve uygulamaları
• Veri yapılarına giriş (Data structures): temel veri yapılarının çalışma mantığı ve kullanım alanları, diziler, listeler, yığın (stack), sıra (queue), ağaçlar (trees) , haritalar (maps), v.b. kavramlar.
• Nesne Yönelimli programlamaya giriş (object oriented programming) : Nesne, kalıtım (inheritance), kapsülleme (encapsulation), çok şekillilik (polymorphism) v.b. kavramlar.
• Veri analizine giriş ve veri kümelerinin yönetilmesi / yüklenmesi
• NumPy temelleri ve temel dizi analizi, vektörize hesaplamalar, dosya işlemleri ve doğrusal cebir (linear algebra), rasgele sayı (random number) üretimi
• Tanımlayıcı istatistiğe giriş (descriptive statistics), Pandas kütüphanesi ve veri yapıları
• Dosya yükleme (Loading) , saklama (Storage) ve dosya formatları
• Veri ön işleme ve ver sarmallama (wrangling): veri kümelerinin birleştirilmesi ve eklenmesi, yeniden şekillendirme (reshaping) ve döndürme (pivoting), veri dönüşümü (data Transformation), ve dizgi işlemleri (string manipulations)
• Tahminci istatistiğe giriş (predictive statistics), scikit-learn kütüphanesi ve temel sınıflandırma, kümeleme ve regrezisyon analizi yöntemlerinin kullanılması
• Çizim ve görselleştirme (plotting and visualization): matplotlib kütüphanesine giriş, pandas ile fonksiyonların görselleştirilmesi, diğer alternatif görselleştirme araçlarına giriş
• Grup operasyonları ile veri birleştirme (data aggregation): GrouBy çalışması, veri birleştirme (aggregation), grup boyunca operasyonlar ve dönüşümler (transformations), pivot tablolar ve çapraz tablolama.
• Zaman Serileri: Tarih ve zaman veri tipleri, zaman serilerine giriş, veri aralıkları (Ranges), frekans ve kayma (shift) kavramları, Priyotlar ve periyodik aritmetik, hareketli pencere fonksiyonları (moving window functions).
• Güncel ve gelişmekte olan veri analizi yöntemlerinin python ile kullanılması: ileri makine öğrenmesi kütüphaneleri, derin öğrenme kütüphaneleri. Vaka Çalışmaları:
Ders kapsamında, uygulama eğitim yolu izlenecektir ve çok sayıda vaka üzerinde veri analizi python dili kullanılarak yapılacaktır. Ders kapsamında verilen örnek veri kümeleri üzerinde katılımcıları gerçek hayat projelerini uygulamaları beklenmektedir.
Ödevler:
Ders kapsamında, 13 farklı ödev verilmesi planlanmaktadır. Bu ödevlerin süresi bir hafta ile iki hafta arasında değişmekle birlikte genelde her hafta yeni bir ödev verilecektir. Ödevler grup halinde yapılacaktır ve her ödev için yeni bir grup kurulacak bu sayede grup çalışması teşvik edilecektir.
Ders içi uygulamalar:
Derste anlatılan konular, katılımcılar ile birlikte birebir örnek veriler üzerinde uygulanacaktır. Bu yüzden katılımcılaırn bilgisayarlarını getirmeleri ve ilk derste anlatılan python yazılımını kurmaları gerekmektedir, ayrıca her ders için gereken ilave kütüphaneler bir önceki derste veya ilgili derste anlatılacaktır.
Ders Web Sitesi
Ders içerikleri ve bu ders izlencesi, www.sadievrenseker.com/python2017 adresinden takip edilebilir. Verilen ödevler, projeler ve gerekli yazılım için bağlantılar sayfada güncel olarak yer alacaktır.
Takım Çalışması ve Takım Üyesi Değerlendirmesi
Öğrenciler kendi takımlarının her bir üyesini projedeki performansına göre değerlendireceklerdir. Her bir öğrenci 100 puanı kendisi de dahil olacak şekilde takım arkadaşlarına dağıtacaktır. Bu dağıtım öğrencinin her bir takım üyesinin projeye katkısını yansıtacak şekilde yapılacaktır. Puanlama, takım üyesinin projeye harcadığı zamanı değil, projeye olan katkısını ölçecek şekilde yapılmalıdır. Katkıdan kasıt, fikir geliştirme, araştırma, analiz, yazı yazma, sözlü sunum, rapor yazma vb.’dir. Eğer takım çalışması iyi ise o zaman öğrenciler aynı puanı diğer takım üyelerine verebilirler. Ancak bazı takım üyeleri kendi yapmaları gerekeni yerine getirmediyse bu durumda puanlar eşit olmayan bir şekilde dağıtılacaktır.
Tüm takım üyeleri tarafından verilen puanlar ders hocası tarafından kümülatif hale getirilecektir. Her bir öğrenci kendi takım arkadaşlarının ve kendisinin verdiği puana göre bir takım çalışması katkı puanı alacak, ama bu puanın nasıl oluştuğu (kimin kime kaç puan verdiği bilgisi) öğrenciler ile paylaşılmayacaktır).
Takım üyeleri arasında bir konsensüs oluşmadığı zamanlarda; örneğin üç öğrencinin puanları eşit dağıtması ve bir öğrencinin farklı puanlama yapması gibi bir durumda, hoca kendi muhakemesini kullanarak takım katkı puanı hesaplayacaktır. Bu hesaplama esnasında takım üyeleri ile görüşmesi gerekebilir.
Eğer birbiri ile çelişen puanlamalar söz konusu ise hoca büyük ihtimalle takım üyeleri ile mülakat yapacak ve ona göre puanlama yapacaktır.
Geçmiş tecrübeler çoğu takımın puanlarını eşit olarak dağıttıkları şeklindedir. Takım çalışmasının proje notunu etkilediği durumlar azınlıkta bulunmaktadır. Bu puanlamanın amacı takımlarına destek olmayan takım üyelerinin hak etmedikleri puanı almanın önüne geçmektir. Aynı zamanda, bazı öğrencilerin payından çok daha fazlasını yapmaları durumunda öğrencinin puanının daha da yukarıya taşımak mümkün olacaktır.
Takım değerlendirmesinin puanlaması sizin proje puanınıza direkt etki edecektir. Örneğin, takım puanı 30 üzerinden 25 ise ve sizin takım üyesi puanlamanıza göre ortalamanın altında bir katkıda bulunduğunuz gözüküyorsa, sizin proje puanınız 25’ten küçük olacaktır. Bu düşürümün miktarı ile ilgili kolay bir kural yoktur. Derste ulaşılması hedeflenenler:
İlk kez programlamaya girecek katılımcılara programlamanın temellerini öğrenebileceği bir ortam sağlamak.
Temel veri yapılarına giriş yapmak
Nesne yönelimli programlamaya giriş yapmak
Python ve kütüphanelerini kullanarak tanımlayıcı (descriptive) ve tahminci (predictive) veri analizi yöntemleri geliştirebilmek
Python ve kütüphanelerini kullanarak görselleştirme projelerini yapabilmek
Python ve kütüphanelerini kullanarak uçtan uca, veri yükleme, veri ön işleme, veri dönüşümü, veri modellemesi ve veri görselleştirmesi işlemlerini yapabiliyor olmak.
Ders İzlencesi:
Hafta 1: Derse giriş, yazılımların tanıtılması, ders izlencesi ve tanışma: temel programlama teknikleri, değişken, döngülere giriş
Son teslim tarihi 27 Ekim 2018 (ders saatine kadar) uzatılmıştır.
Hafta 2: Yapısal programlamaya (structural programming) giriş : koşullar (if, else, elif:) for döngüleri, range fonksiyonu, ve fonksiyon kavramına ( def f(x): ) giriş ve uygulamaları
if, else ve elif kullanımı ve koşullar : untitled.py
If kavramı, kullanıcıdan sayı okumak ve int değerine dönüştürmek. Verilen bir 100’lük notun harf notuna dönüşümü örneği: ikinci.py
Döngü kavramı ve while, for döngüleri: ucuncu.py
range ve liste kavramları ve for döngüsünü kullanarak ortalama, toplam hesaplama: dort.py
Kullanıcıdan -1 girilene kadar sayı alan ve bu sayıların toplamını döndüren kod (break ve continue kavramları): bes.py
Fibonacci serisini hesaplayan fonksiyon: alti.py
Faktöriyel ve Kombinasyon hesaplayan fonksiyonlar: yedi.py
değişken ve liste çağrılması ve fonksiyon içerisinde yapılan değişiklerin çağrılan yere etkisi (kopyalayarak çağırma ve referans ile çağırma (call by value, call by reference) kavarmları: sekiz.py
bir liste alarak listedeki sayilarin toplamini döndüren fonksiyon : dokuz.py
Parametre sayısı belirsiz parametreyi alıp işleyen fonksiyon ( *l ) : on.py
Hafta 3: Veri yapılarına giriş (Data structures) ve Nesne Yönelimli programlamaya giriş (object oriented programming) : Nesne, kalıtım (inheritance), kapsülleme (encapsulation), çok şekillilik (polymorphism) v.b. kavramlar. temel veri yapılarının çalışma mantığı ve kullanım alanları, diziler, listeler, yığın (stack), sıra (queue), ağaçlar (trees) , haritalar (maps), v.b. kavramlar.
Ödev 3:Kaggle üzerinde birer hesap açınız ve ayrıca şu tutorial’da bulunan adımları 4. bölüme kadar (4. bölüm hariç) yapınız ve kodlarınızı ve çıktılarınızı yollayınız: tutoriala erişmek için tıklayınız
Derste Yazılan Kodlar (2017 yılı için) (Kitabın 2. Bölümündeki ilk örneği (bitli/usa.gov veri kümesi ile olanı) yaptık ve çalıştırdık. Notlanmayacak bir ödev olarak yine kitabın 2. bölümündeki diğer 2 veri kümesini çalıştırmanızı tavsiye ederim.
Hafta 6-7 : NumPy ve Pandas temelleri ve Tahminci Analitiğe Giriş (Predictive Analytics) temel dizi analizi, vektörize hesaplamalar, dosya işlemleri ve doğrusal cebir (linear algebra), rasgele sayı (random number) üretimi Ödev 2 Çözümü , Ödev 4:NumPy problemleri ve çözümleri (çözümleri deneyerek tek bir dosya halinde yollamanız yeterlidir)
Ders 24: Çoklu Değişkenlerdeki Problemler ve Çözümleri
Ders 25: Kukla Değişken (Dummy Variable) ve Kukla Değişken Tuzağı
Ders 26: Çalışma Ödevi 1: P-Value
Ders 27: P-Value
Ders 28: Değişken Seçimi ve Geri Eleme (Backward Elimination), İleri Seçim (Forward Selection), Çift Yönlü Seçim (Bidirectional Elimination) yöntemleri
Ders 29: Çoklu Doğrusal Regresyon Kodlaması: Veri Kümesini Hazırlama
Hafta 10: SCI-KIT Learn Kütüphanesine giriş ve makine öğrenme algoritmaları (Rapid Miner, Knime ve Python kütüphanelerinin karşılaştırmalı çalıştırılması)
Yazılan Örnek kodlar (cinsiyet excel dosyasından makine öğrenmesi ve sınıflandırma örnekleri), aşağıdaki algoritmalar için çalışmaktadır.
Görev 1: Titanic veri kümesini yükleyerek derste üzerinden geçilen algoritmalardan en az birisi ile hayatta kalan veya kalmayanları tahmin etmeye (sınıflandırmaya) çalışın.
Görev 2: Derste işlenen bütün algoritmaları deneyin ve hangisinin en başarılı olduğunu yorumlayın (bir iki satır yazarak anlatın).
Görev 3: Bu işlemler sırasında bütün verileri (sayısal veya nominal) kullanın (herhangi bir kolonu dışarıda bırakmayın, eksik veya kirli veri varsa önizlemeye tabi tutun, kullandığınız algoritma, veri tipi ile uyumlu değilse veriyi uyumlu hale dönüştürün).
Hafta 11
SCI-Kit Learn ile a priori algorithması ve birliktelik kural çıkarımı
Bölütleme-Kümeleme örnekleri ve kodları (clustering)
Hata ölçüm yöntemleri : Root Mean Square Error (RMSE), R2 Score , RAE, MAE
K-Means Algoritması ve Kodlaması
k-Fold Cross Validation ve Leave One Out yöntemleri
Linear Modeller ve Linear Regression, Polynomial Regression
Bölütleme (kümeleme) problemlerine genel giriş ve kullanım alanları
Bölüm 5.1: K-Orta Algoritması (K-Means)
Kavrama ve algoritmaya giriş
Rassal Başlangıç Tuzağı
K-Means algoritmasında küme sayısına karar verilmesi
Veri odaklı programlama dersi proje duyurusu (minimum olması gerekenler)
Proje önerisi en geç 1 Aralığa kadar yollanacak : Kısa problem tanımı ve veri tanımı (nasıl erişileceği ve verinin detayları):
hangi tarihte sunum istendiği belirtilecek (15 aralık veya 22 aralık veya fark etmez)
Projeler tek kişi olacak, kendi problemleriniz (çalıştığınız yer ile ilgili olması tercih sebebidir). Şayet olmuyorsa kaggle.com’dan problem seçip önerilebilir.
Teslim edilecekler (teslim için 14 Aralık son tarih) : 1Proje raporu + 2 Sunum + 3 Çalışan kod (CRISP-DM metodolojisi kullanılacak)
Schedule:Wed 15.00 – 17.00 and Fri 16.00 – 17.00 -> Updated to Wed 15.00 – 18.00
Location : ACAD Building 1302
Course Description:
MIS is one of the key concepts for the today’s organizations. We mainly focus on the core technologies in modern enterprises and their management strategies and key concepts. This course is not a technology or computer or software course. Instead we focus on the leverage of the information systems, to operate efficiently. Whether the organization is a new entrepreneurial start-up, an established business, a non-profit, or a government enterprise, its ability to deliver on its mission and implement its strategy could be significantly impeded without knowledgeable individuals to guide the design, acquisition, effective use, and support of the information systems that provide the foundation for the organization.
Because the role of MIS is critical for many organizations, it has become an exciting career choice that allows you the flexibility to apply the skills you develop through your study of management information systems to a broad range of disciplines. An organization is made up of four key components—technology, data, processes, and people. A career in MIS can offer you many options: you could take a strategic approach and become a systems or enterprise architect who is an expert in integrating across these components; or you could become a specialist in data analytics, process redesign, or technology management. What distinguishes MIS from other types of information technology is the recognition of the role and importance of people in both enabling and constraining organizations.
The guiding principle behind this course is that for an enterprise to run efficiently, its information systems need to work efficiently. Modern organizations are simply too complex, with too many people and too much data, for work to be done manually or inefficiently.
Course also concentrates on the digital firm and data management concepts. One of the major key concepts in the course is monetizing the technology and data in the new technology age.
Course Objective:
understand and articulate fundamental concepts of information technology management.
assess and apply IT to solve common business problems.
suggest and defend effective solutions to business problems, and design a database application to solve a business problem.
discuss the ethical aspects of information technology use in the organization and its governance issues.
Reference Text Book and other Resources:
Management Information Systems: Managing the Digital Firm, Kenneth C. Laudon and Jane P. Laudon, 15th edition, 2017, Pearson
Grading
Case Studies, Homework, Reading, Attendence and Discussions: 30%
Project: 30%
Final Exam: 40%
Course Content:
I. Organizations, Management, and the Networked Enterprise
1. Information Systems in Global Business Today
2. Global E-business and Collaboration
3. Information Systems, Organizations, and Strategy
4. Ethical and Social Issues in Information Systems
II. Information Technology Infrastructure
5. IT Infrastructure and Emerging Technologies
6. Foundations of Business Intelligence: Databases and Information Management
7. Telecommunications, the Internet, and Wireless Technology
8. Securing Information Systems
III. Key System Applications for the Digital Age
9. Achieving Operational Excellence and Customer Intimacy: Enterprise Applications
10. E-commerce: Digital Markets, Digital Goods
11. Managing Knowledge
12. Enhancing Decision Making
13. Building Information Systems
14. Managing Projects
15. Managing Global Systems
Weekly Plan
Week 1 (Feb 28) : Introduction to Course Content and Syllabus
Week 2 (Mar 7): Introduction to Global Systems and Key Concepts (Slides) :
Data, Information, Knowledge and Wisdom Pyramid,
Business Information Value Chain
Management Levels ( Senior, Midlevel and Operational)
Plans (Strategic, Tactic and Optimum Planning)
Blackbox Approach to system and I/O of Information System and Feedback
Information System and Relations between Organization, Technology and Management
Retail Value Chain
Week 3 ( Mar 14): Global e-business and Collaboration (Slides , Slides (PPT) ):
Introduction to Knowledge Economy
Knowledge Workers
Knowledge Management
Development Stages, Industrializaion and Knowledge economy
Tacit vs Explicit Knowledge
Types of Capital: Intellectual Capital, Social Capital
Transaction Processing Systems
Relation among Knowledge, Process and People
Enterprise Application Architecture
Knowledge Management Framework
Week 4 ( Mar 21): Information Systems, Organizations and Strategy ( Slides ):
Comparative Definition of Organization
Key Relations between Organization and IS
Systems Approach and Black Box
Business Processes and Routines
Organizational Culture
IS effect 1: Flattening organizations
IS effects 2: Resistance to change (Technology acceptance model)
IS effects 3: Digitalization
Strategical, tactical and optimum planning
Porter’s competitive forces model
Value chain model
The value web
BCG Matrix
IS effect 4: strategy and DSS
Week 5 ( Mar 28): Introduction to IT and key concepts (Slides)
Some Key Concepts:
Relation between Business Strategy, IT Strategy and Information Technology,
Brief history of computers and evolution of computer architectures
Client Server architecture and n-tiered architectures
Moore’s Law
Metcalfe’s Law
Databases
Operating Systems
Open Source and Free Softwares
Cloud Computing
Green Computing
TPS and Transaction Cost Theory
Agency Cost Theory
SOA (Service Oriented Architecture)
Privacy and IT Relation: Privacy of employees and Corporate Privacy and Secrecy
Case Study 1: (Due Date: May 2) Prepare an essay about IT and computers and address the questions below:
What has been the impact of faster and cheaper computers for personal and company use? What technological advances and benefits are driving the expansion in the use of personal computers? What are the limitations of faster and cheaper computers? If you cannot think of a strategy for answering this question, you may want to consider weaving all or some of the Case Learning Outcomes into your response by addressing the following: 1. What are the main components of personal computers used in an office environment? 2. How has the cost of computers used in an office changed over the past 30 – 40 years? Which main component of the computer is driving this change? 3. What has been the result of this cost change in the last 20 years? 4. What limits the price from changing drastically in the future? 5. What is e-waste and why is it a problem?
Week 6 (Apr 4): Business Intelligence, Database and Information Management ( Slides )
Projects : What to do?, How to do? Groups, project topics and discussions.
Case Study 2: (Due Date: May 9): Read the following case study (click here) and discuss below questions
What is the business strategy of HiCar?
What are the tactics of HiCar?
How would you differentiate strategic and tactical objectives?
Would you add or update any part of their ICT model if they operate outside of EU, such as Turkey?
Suggest an update for HiCar with self driving cars (cars do not need any driver). Think about, charging stations, parking, delivery or entertainment in these new cars and suggests an update to the HiCar information model and business rules, explain the updates and their complications in detail.
Week 7 (Apr 11): Telecommunication, Internet and Wireless Technologies ( Slides )
Public Key Cryptography vs Private Key Cryptography
Homework 3: Prepare a telecommunication strategy for your business ( Due Date : May 2)
Case Study 3 (Due Date: May 16): Read the following case study ( click here ) and discuss below questions:
What are the strengths and weaknesses of UK Electrol system in the case study?
In your opinion, what are the most critical components of the system and if you would change one of these components, which one would you change and how?
Draw a database diagram for holding possible data tables of the system
Draw a deployment diagram for the possible information system
Point out the possible security problems and suggest solutions for them.
What would you like to monitor on the system if you would design a BI dashboard?
Submissions this week : Project Proposal Report, Homework 1
Week 9 (Apr 25): Operational Excellence and Customer Intimacy (Slides)
Homework 4: Prepare a network strategy for your organization (Due Date: May 9)
Submissions to this week : Business Plan for your project, Homework 2
Week 10 (May 2): Digital Markets Digital Goods and Digitalization (Slides)
Homework 5: Prepare a security plan for your organization. (Due Date: May 16)
Submissions to this week : Case Study 1, Homework 3
Dersin Adı: Uygulamalı İleri İş Analitiği Yöntemleri, Uçtan Uca Veri Bilimi Uygulamaları (End-to-end Data Science Practicum)
Dersin Kodu: IAN 506
Dönemi: Bahar 2018
Kredisi : 3
Öğretim Üyesi: Doç. Dr. Şadi Evren ŞEKER
İletişim: veribilimi2018@sadievrenseker.com
Ders İçeriği:
Bu dersin amacı, yüksek lisans programında bulunan derslerde edinilen bilgi birikimini pekiştirmek ve birleştirmektir. Bu amaçla tanımlayıcı analitik (Descriptive analytics), tahminci analitik (predictive analytics) ve buyrukçu analitik ( prescriptive analytics) kavramları birleştirilerek uygulamalar yapılacaktır. Ders kapsamında aşağıda listelenen araçlar karşılaştırmalı olarak kullanılacaktır:
Rapid Miner
R
Python
Knime
Weka
Ayrıca güncel konulara da yer verilecek ve örneğin derin öğrenme gibi konular için de tensor flow benzeri kütüphanelere giriş yapılacaktır.
Dersin amacı, katılımcıları, veri bilimi, veri analitiği ve iş analitiği dünyasında kullanılan temel teknolojileri, algoritmaları ve görselleştirme / analiz araçlarını temel düzeyde kullanacak seviyeye getirmektir.
Kaynak Kitaplar
Python for Data Analysis, 2nd Edition Data Wrangling with Pandas, NumPy, and IPython, William McKinney, 2017
Learning scikit-learn: Machine Learning in Python Paperback – November 25, 2013, Raúl Garreta, Guillermo Moncecchi
Building Machine Learning Systems with Python , Willi Richert, Luis Pedro Coelho , 2013
Ders boyunca öğrencilere okumaları gereken bazı ufak vaka çalışmaları ile makaleler verilecektir.
Vaka Çalışmaları:
Ders kapsamında, uygulama eğitim yolu izlenecektir ve çok sayıda vaka üzerinde veri analizi python dili kullanılarak yapılacaktır. Ders kapsamında verilen örnek veri kümeleri üzerinde katılımcıları gerçek hayat projelerini uygulamaları beklenmektedir.
Ödevler:
Ders kapsamında, 5 farklı ödev verilmesi planlanmaktadır. Bu ödevlerin süresi bir hafta ile iki hafta arasında değişmekle birlikte genelde her hafta yeni bir ödev verilecektir. Ödevler bireysel olarak yapılacaktır.
Projeler:
Ders kapsamında, her öğrenciye bir dönem projesi verilmesi ve projenin baştan sona öğrenci tarafından yürütülerek raporunun ve sunumunun hazırlanması beklenmektedir. Projelerin rapor ve proje dosyası dışında sunumları 19 ve 26 Mayıs tarihlerinde yapılacaktır. En geç proje teslim tarihi (rapor + sunum + proje dosyası) 18 Mayıs’tır. (Güncellendi: Proje teslim tarihleri aşağıdaki notlama kısmında belirtilen şekilde güncellenmiştir).
Proje Notlama:
Sunum günü sabah 9’da yapılacak yoklama : 10%
25 Mayıs 2018 (sunumdan bir gün önce) en geç gece yarısına kadar proje raporu ve sunumu yollamış olmak : 10%
Uçtan uca (CRISP-DM adımlarının tamamı sorgulanacaktır) çalışan bir proje teslimi : 40%
Problemi doğru adreslemek ve tam olarak çözen bir model geliştirmek : 10%
Doğru veri ön işleme adımları : 10%
Doğru modellerin denenmiş olması : 10%
Modellerin iyileştirilmesi : 10%
Doğru değerlendirme kriterlerinin tanımı ve modellerin ölçümü : 10%
Ders içi uygulamalar:
Derste anlatılan konular, katılımcılar ile birlikte birebir örnek veriler üzerinde uygulanacaktır. Bu yüzden katılımcılaırn bilgisayarlarını getirmeleri ve ilk derste anlatılan python yazılımını kurmaları gerekmektedir, ayrıca her ders için gereken ilave kütüphaneler bir önceki derste veya ilgili derste anlatılacaktır.
Derste ulaşılması hedeflenenler:
Veri bilimi proje yönetim tekniklerini ve projenin başlangıç, bitiş koşullarını tanımlayabiliyor olmak.
Bir veri bilimi projesini baştan sona yönetebiliyor olmak.
Veri bilimi için kritik olan problem algılama, problemleri sınıflandırma ve literatürde konumlama yeteneğine sahip olmak.
Gerekli veri ön işleme aşamalarını yapabiliyor olmak ve proje sürecinde doğru ön işleme aşamalarına karar vermek
Veri bilimi dünyasında sık kullanılan makine öğrenmesi ve istatistiksel modelleri tanıyor ve probleme uygun olarak doğru parametrelerle kullanabiliyor olmak.
Veri bilimi projesinin çıktılarını doğru yargılayabiliyor ve sunabiliyor olmak.
Ders İzlencesi:
Hafta 1 (10 Mart): Derse giriş, izlenecek metodoloji (CRISP-DM), Veri Önişleme kavramlarına giriş
Hafta 3 (24 Mart) : Regresyon modellerine giriş (basit doğrusal, çoklu doğrusal regresyon (multiple linear regression)) , korelasyon matrisi, p-value ve değişken seçimi, backward elimination, forward selection (knime dosyaları: dosya 1 , dosya 2)
Hafta 4 (31 Mart): Regresyon modelleri ve karşılaştırma yöntemleri (Decision Tree, Random Forest, Linear, Polynomial) (knime dosyasını indirmek için tıklayınız)
Hafta 5 (7 Nisan): Tahmin modellerinin karşılaştırılması (R2 ve adjusted R2 hesaplanması), Sınıflandırma problemlerine giriş ve Logistic Regression
Proje Konusu: Dönem sonuna kadar yapmayı planladığınız bir proje konusu belirleyiniz. Proje konusu ile ilgili konuyu açıklayan (iş süreci ve veri açıklaması çok önemli (crisp-dm hatırlayınız)) ve tahmini olarak izleyeceğiniz veri ön işleme, model oluşturma ve değerlendirme adımlarını içeren bir raporu gönderiniz (teslim tarihi: 14 Nisan).
Ödev 1: Tahmin (Prediction Uygulaması): Geliştireceğiniz veri önişleme ve tahmin yöntemleri ile günlük borsa tahmini, ve dolar kuru tahmini yapan knime projeleri geliştiriniz, başarınızı nasıl ölçtüğünüzü tartışınız ve başarının iyileştirilmesi için izlediğiniz yolları anlatınız. (teslim tarihi: 21 Nisan)
Hafta 6 (14 Nisan): Zaman Serisi (Time Series Analysis) Analizi , Sınıflandırma algoritmaları, SVM, Decision Tree ve Random Forest
Hatırlatma! : Proje konusu için son teslim tarihi gece yarısına kadardır.
Ödev 1 Değerlendirme: Ödev 1’de kullandığınız veri kümesinden de faydalanarak (sadece son kolon için) aşağıdaki tabloyu tamamlayınız (Teslim Tarihi 28 Nisan).
Ödev 2: Sınıflandırma (Classification) Uygulaması: Kaggle üzerindeki reklam takibi ve sahtekarlık yakalama ile ilgili şu yarışmaya katılınız. (link için tıklayınız) Burada bulunan eğitim ve test verilerini indirerek en az, derste öğrendiğimiz algoritmalar (Logistic Regression, KNN, SVM, Decision Tree, Random Forest) ve bu algoritmaların parametrelerini kullanarak sınıflandırma modellerinizi çalıştırınız. (Teslim tarihi 28 Nisan)
Proje İlerleme Raporu 1: Projenizde CRISP-DM metodunu kullanarak 3 döngüde ilerlemeniz hedeflenmektedir. Dolayısıyla, CRISP-DM’de bulunan adımları 3 kere dönecek ve her döngüde iyileştirmeler yapacaksınız. İlk döngünün ilk iki adımı olan problem analizi ve veri analizi raporlarınızı hazırlayınız (problemi ve veriyi tanımlayın). (Teslim tarihi 21 Nisan)
Zaman Öznitelik Çıkarımı (tarih ve Saat için): (knime dosyası için tıklayınız) (örnek CSV dosyası ödev 2’de bulunan kaggle projesindeki örnek (train_sample.csv) dosyasıdır)
Hafta 7 ( 21 Nisan): Sınıflandırma Algoritmaları Özet ve Kümeleme Algoritmaları
Hatırlatma!: Proje ilerleme Raporu 1 ve 1. Ödev için son teslim tarihi gece yarısına kadardır.
Ödev 2 Değerlendirme: Ödev 2’de kullandığınız veri kümesinden de faydalanarak (sadece son kolon için) aşağıdaki tabloyu tamamlayınız (Teslim Tarihi 5 Mayıs).
Proje ilerleme Raporu 2: Projenizde farklı veri ön işleme yöntemleri kullanarak çıktıları karşılaştırınız, işlenmesi ve çözülmesi gereken önemli problemleri tanımlayarak hangi veri işleme yöntemleri ile çözdüğünüzü açıklayınız. (örneğin, eksik veri, gürültülü veya kirli ver, tarih veya zaman alanları, veri zenginleştirme, dengesiz veri vs.)
Ödev 3: Kümeleme Problemleri Uygulaması: Ekte bulunan bağlantıdan Customer Excel dosyasını indiriniz (bağlantı için tıklayınız) ardından Excel’de oluşturulan özet tabloyu (pivot) knime ile oluşturun (Exceldeki sheet3 sayfasında) ve kmeans algoritmasını kullanarak derste yaptığımız üç işlemin benzerlerini aşağıdaki şekilde gerçekleştirin (Teslim tarihi 12 Mayıs)
1. müşteri segmentasyonunu oluşturun (mantıklı olan öznitelikleri kullanarak)
2. Aylara ve bölgelere göre pivot tablosunu oluşturun
3. indirim oranına göre müşteri segmentlerini çıkarın
4. Bölgelere göre segmentasyon yaparak teklifler (offerinformation) ve işlemler (transaction) karşılaştırın
Hatırlatma! : Proje İlerleme Raporu 2, Ödev 1 değerlendirme raporu ve Ödev 2 için son teslim gece yarısına kadardır.
Ödev 4: Bir önceki ödevde ( Ödev 3) elde ettiğiniz önizlemesi tamamlanmış veriyi, Hiyerarşik Bölütleme / Kümeleme ve K-Means ve K-Medoids yöntemlerine göre bölümleyin. En verimli bölüt sayısını (WCSS dirsek metodunu ve dendrogram metodunu kullanarak) bulun ve çıkan bölümleme sonuçlarını raporlayarak karşılaştırın. (Teslim tarihi 19 Mayıs)
Proje ilerleme Raporu 3: Projenize uygun veri madenciliği modellerini belirleyerek hangi yöntemleri neden seçtiğinizi açıklayınız. Ardından, yöntemleri deneyerek çıktıları karşılaştırınız. Kullandığınız yöntemlere uygun olarak değerlendirme (evaluation) metriklerini belirleyin, hangi metrikleri ve neden kullandığınızı açıklayın. Son adımda, yöntemleri iyileştirmek için gerekli parametre iyileştirmelerini yaparak hangi parametreleri neden ve nasıl iyileştirdiğinizi açıklayınız.
Bölütleme / Kümeleme Algoritmaları : K-Means, K-Medoids ve Hierarchical Clustering (HC) Yöntemlerinin karşılaştırılması. K-Means için WCSS kullanılarak en optimum bölüt sayısının bulunması ve HC için dendrogram kullanarak en optimum bölüt sayısının bulunması ve HC için farklı linkage yöntemleri (min, Max, group average, center, ward’s method) : aşağıdaki knime workflow’u indirmek için tıklayınız.
Yukarıda yapılan workflow adımları:
1. Iris verisini yükleyin
1.1. column filter ile sınıf bilgilerini atın
2. K-Means ve K-Medoids için
2.1. Kümeleme için en ideal K değerini bulun (entropy)
2.2. K-means ve K-medoids ile kümeleme yapın
3. Hierarchical Clustering(HC) için en ideal K değerini bulun
(dendrogram kullanarak)
4. HC ile kümeleme yapın
5. K = 3 için 3 yöntemi de tekrar çalıştırın
6. Orjinal Sınıf bilgileri ile K=3 için çıkan sonuçları karşılaştırın
7. Başarısı en yüksek olan bölütleme yöntemini raporlayın.
Elde edilen sonuçlar:HC : 150 ‘de 24 hata
KMeans : 17 hata
KMedoids : 16 hata
İptal : Hafta 9 ( 5 Mayıs) : Bu hafta ders yapılmayacaktır.
Hatırlatma! : Ödev 2 Değerlendirme için ve Proje İlerleme Raporu 3 için son teslim tarihi gece yarısına kadardır.
Proje ilerleme Raporu 4: Projenizdeki bütün adımları 2. kere geçerek başarıda iyileştirmeye gitmeye çalışın, denemelerinizi ve ulaştığınız sonuçları raporlayın.
Hafta 10 ( 12 Mayıs): Metin Madenciliği (Text Mining)
Hatırlatma! : Ödev 3 ve Proje İlerleme Raporu 4 için son teslim tarihi gece yarısına kadardır.
Ödev 5: RSS Feed kullanarak bir gazetenin ekonomi, politika ve magazin haberlerini çekin (3 sınıf olması yeterli, bu sınıfları değiştirebilirsiniz). Ardından bu haberleri etiketlemeden kümeleme (clustering) algoritmaları ile 5 farklı kümeye bölün. Orijinal verinizdeki 3 sınıfın hangi kümeye, ne oranda dağıldığını bulun. (Teslim tarihi 26 Mayıs)
Proje ilerleme Raporu 5: Projenizdeki bütün adımları 3. kere geçerek başarıda iyileştirmeye gitmeye çalışın, denemelerinizi ve ulaştığınız sonuçları raporlayın.
Tatil: Hafta 11 ( 19 Mayıs) : Pekiştirmeli Öğrenme Tekrar ve Karmaşık Olay İşleme (Complex Event Processing)
Hatırlatma! : Proje İlerleme Raporu 5 için son teslim tarihi gece yarısına kadardır. Proje dosyalarının teslimi için son tarih 25 Mayıs gece yarısına kadardır. Ödev 4 için son teslim tarihi gece yarısına kadardır.
Proje Nihayi Raporu ve Sunum: Şimdiye kadar olan proje adımlarını birleştirerek tek bir rapor haline getirin ve sunumunuzu hazırlayarak yollayın (Son Teslim Tarihi 25 Mayıs gece yarısıdır).
Hafta 12 ( 26 Mayıs) : Proje Sunumları, Saat 9:00’da başlayacaktır ve 9’da yoklama alınacaktır
Hatırlatma!: Proje dosyalarının teslimi için son tarih 25 Mayıs gece yarısına kadardır. Ödev 5 için son teslim tarihi gece yarısına kadardır.
Notlar
Notlarınız teslimlere göre buradan duyurulmaktadır. Ders kapsamında geç gönderme ile ilgili bir uygulama bulunmadığı için (istisna olarak proje ile ilgili durum yukarıda belirtilmiştir) lütfen vaktinde ödev ve projelerinizi teslim edin, aksi halde değerlendirmeye alınmayacaktır.
Kişisel bilgilerin korunması gereği, isim yerine okul numaralarınız ile notlarınız duyurulmaktadır.
Course Description: This course is an introduction level course to data analsis, specialized on business processes and real life cases.
This course will uncover you of the information analytics hones executed in the business globe. We will investigate such magic ranges Concerning illustration the explanatory process, how information will be created, stored, accessed, what’s more entryway the association meets expectations with information and makes nature’s turf in which analytics could prosper. The thing that you take in this span will provide for you An solid framework On the whole those territories that backing analytics What’s more will assistance you on preferred position yourself to victory inside your association. You’ll create abilities What’s more An viewpoint that will settle on you All the more profitable speedier Also permit you should turned a profitable advantage should your association. This span additionally gives a support for setting off deeper under propelled investigative Furthermore computational methods, which you bring a chance to investigate On future courses of the information Analytics for benefits of the business specialization.
This course is outlined with have wide bid over Numerous sorts from claiming learners. Anybody who is looking should get an Comprehension about how benefits of the business analytics is really performed for genuine associations will profit. This course will be essential pointed toward experts who have a bachelor’s degree or A percentage introduction of the benefits of the business reality. The individuals for specialized foul degrees or a greater amount propelled business degrees like a mba will discover certain ranges simpler will absorb, What’s more might get most extreme esteem from those span. However, Indeed undergraduates to non-technical fields or propelled high-school people seeking after internships will have the capacity on take after mossycup oak ideas Also get quality from the span. Finally, Significantly experts who bring required profound encounters over systems will inclined discover esteem in this course.
Course Objective:
1. Understanding of real life cases about data
2. Understanding of real life data related problems
3. Understanding of data analysis methodologies
4. Understanding of some basic data operations like: preprocessing, transformation or manipulation
5. Understanding of new technologies like bigdata, nosql, cloud computing
6. Ability to use some trending software in the industry
7. Introduction to data related problems and their applications
Method:
List of course software:
· Excel,
· KNIME,
· RapidMiner
· MS-SQL, SSAS, SSIS
· Oracle Database, ODI, BI
· Apache Cassandra
This course is following hands on experience in all the steps. So attendance with laptop computers is necessary. Also the software list above, will be provided during the course and the list is subject to updates.
Grading
Reading, Attendence and Discussions: 30%
Homeworks: 30%
Project: 40%
Course Content:
Week 1: Introduction to Data, Problems and Real World Examples:
Homework #1 (Due Date: Nov. 23, 2017) : Download the data set of customers (click to download). In the data set you can see, each record is holding the salary and age of the customer and their action in the store (buy: they buy a product, notbuy: they don’t buy any product). Create your own Rapid Miner data flow and decide if the below customers buy or not:
Salary
Age
1000
21
2300
22
4300
25
Write a brief explanation for your submission (which algorithm did you use, what are the results you have achieved and how)
Analytical Problems and Analysis
Business Model, conceptualization and frameworks
Information – Action Value Chain
Data Capturing and data sources: Thinking in Data
Analytical Technologies: Data Storage
Analytical Technologies: Big Data, Cloud and Evolution of Web
Analytical Technologies: Relational Databases
Analytical Technologies: Virtualization, In Memory and NoSQL
Analytical Technologies: Introduction to SQL: Simple Queries
Analytical Technologies: SQL – 2: Multiple Tables, Sub Queries
Data Mining and Data Science Basics 1: Classification Problems
Data Mining and Data Science Basics 2: Regression and Prediction
Ders İçeriği:
Veri odaklı programlama dersinin 3 farklı seviyeden öğrencilere hitap etmesi beklenmektedir. Henüz programlama ile yeni tanışan kişiler, programlama hakkında bilgisi olan ama çok fazla tecrübesi ve uzmanlığı olmayan kişiler ve progralama konusunda tecrübeli ve uzman ancak veri odaklı progralmama konusuna yeni olan katılımcılar.
Dersin amacı, programlama bilgisi olmayan kişilerin programlama dilleri ile ilk kez karşılaşacağı ve kodlamanın temellerini öğreneceği ve sonrasında veri odaklı program yazabileceği geçişi sağlamaktır.
Programlama geçmişi olan kişilere ise daha çok veri temelli program yazabilecekleri, veri analizinde karşılaşacakları problemlere karşılık gelen uçtan uca problem çözümlerini geliştirebilecekleri programlama yeteneklerini öğretmektir.
Ders kapsamında Python programlama dili öğretilecek olup, dilin temellerinin yanında veri analizine yönelik olarak, python dili içerisinde bulunan bazı kütüphaneler aşağıdaki şekildedir:
· NumPy
· SciPy
· Pandas
· Matplotlib
· Scikit-learn
Ayrıca güncel konulara da yer verilecek ve örneğin derin öğrenme gibi konular için de tensor flow benzeri kütüphanelere giriş yapılacaktır.
Dersin amacı, katılımcıları, veri bilimi, veri analitiği ve iş analitiği dünyasında kullanılan temel teknolojileri, algoritmaları ve görselleştirme / analiz araçlarını temel düzeyde kullanacak seviyeye getirmektir.
Kaynak Kitaplar
Python for Data Analysis, 2nd Edition Data Wrangling with Pandas, NumPy, and IPython, William McKinney, 2017
Learning scikit-learn: Machine Learning in Python Paperback – November 25, 2013, Raúl Garreta, Guillermo Moncecchi
Building Machine Learning Systems with Python , Willi Richert, Luis Pedro Coelho , 2013
Ders boyunca öğrencilere okumaları gereken bazı ufak vaka çalışmaları ile makaleler verilecektir.
Derse Katılım:
Ders boyunca öğrencilere okumaları gereken bazı ufak vaka çalışmaları ile makaleler verilecektir.
Derse Katılım:
Ders 3 modülden oluşmaktadır.
1. Programlamaya giriş (hiç bilmeyenler için)
2. Makine öğrenmesi ve veri analitiğine giriş
3. İleri veri analitiği yöntemleri
Katılımcılar, farklı bilgi düzeylerinden geldikleri için ilk modüle katılım zorunlu olmamakla birlikte verilen bütün ödev ve projelerin yapılması zorunludur. Sadece 3 hafta sürecek, ilk modül için benimle görüşerek öncesinde izin alabilir ve ödev/projeleri yaparak ilk modülden muaf sayılabilirler. Bunun dışında, derse katılım zorunlu olup, özel durumlar için önceden haberleşilerek izin alınabilir. Dersleri kaçırma veya tekrar çalışma ihtimallerine karşı, ders boyunca dijital içerik oluşturularak öğrencilerle azami seviyede paylaşılmaya çalışılacaktır. Derste yapılacaklar:
• Yapısal programlamaya (structural programming) giriş : temel programlama teknikleri, değişken, döngü, koşullar ve fonksiyon gibi temel kavramlara giriş ve uygulamaları
• Veri yapılarına giriş (Data structures): temel veri yapılarının çalışma mantığı ve kullanım alanları, diziler, listeler, yığın (stack), sıra (queue), ağaçlar (trees) , haritalar (maps), v.b. kavramlar.
• Nesne Yönelimli programlamaya giriş (object oriented programming) : Nesne, kalıtım (inheritance), kapsülleme (encapsulation), çok şekillilik (polymorphism) v.b. kavramlar.
• Veri analizine giriş ve veri kümelerinin yönetilmesi / yüklenmesi
• NumPy temelleri ve temel dizi analizi, vektörize hesaplamalar, dosya işlemleri ve doğrusal cebir (linear algebra), rasgele sayı (random number) üretimi
• Tanımlayıcı istatistiğe giriş (descriptive statistics), Pandas kütüphanesi ve veri yapıları
• Dosya yükleme (Loading) , saklama (Storage) ve dosya formatları
• Veri ön işleme ve ver sarmallama (wrangling): veri kümelerinin birleştirilmesi ve eklenmesi, yeniden şekillendirme (reshaping) ve döndürme (pivoting), veri dönüşümü (data Transformation), ve dizgi işlemleri (string manipulations)
• Tahminci istatistiğe giriş (predictive statistics), scikit-learn kütüphanesi ve temel sınıflandırma, kümeleme ve regrezisyon analizi yöntemlerinin kullanılması
• Çizim ve görselleştirme (plotting and visualization): matplotlib kütüphanesine giriş, pandas ile fonksiyonların görselleştirilmesi, diğer alternatif görselleştirme araçlarına giriş
• Grup operasyonları ile veri birleştirme (data aggregation): GrouBy çalışması, veri birleştirme (aggregation), grup boyunca operasyonlar ve dönüşümler (transformations), pivot tablolar ve çapraz tablolama.
• Zaman Serileri: Tarih ve zaman veri tipleri, zaman serilerine giriş, veri aralıkları (Ranges), frekans ve kayma (shift) kavramları, Priyotlar ve periyodik aritmetik, hareketli pencere fonksiyonları (moving window functions).
• Güncel ve gelişmekte olan veri analizi yöntemlerinin python ile kullanılması: ileri makine öğrenmesi kütüphaneleri, derin öğrenme kütüphaneleri. Vaka Çalışmaları:
Ders kapsamında, uygulama eğitim yolu izlenecektir ve çok sayıda vaka üzerinde veri analizi python dili kullanılarak yapılacaktır. Ders kapsamında verilen örnek veri kümeleri üzerinde katılımcıları gerçek hayat projelerini uygulamaları beklenmektedir.
Ödevler:
Ders kapsamında, 13 farklı ödev verilmesi planlanmaktadır. Bu ödevlerin süresi bir hafta ile iki hafta arasında değişmekle birlikte genelde her hafta yeni bir ödev verilecektir. Ödevler grup halinde yapılacaktır ve her ödev için yeni bir grup kurulacak bu sayede grup çalışması teşvik edilecektir.
Ders içi uygulamalar:
Derste anlatılan konular, katılımcılar ile birlikte birebir örnek veriler üzerinde uygulanacaktır. Bu yüzden katılımcılaırn bilgisayarlarını getirmeleri ve ilk derste anlatılan python yazılımını kurmaları gerekmektedir, ayrıca her ders için gereken ilave kütüphaneler bir önceki derste veya ilgili derste anlatılacaktır.
Ders Web Sitesi
Ders içerikleri ve bu ders izlencesi, www.sadievrenseker.com/python2017 adresinden takip edilebilir. Verilen ödevler, projeler ve gerekli yazılım için bağlantılar sayfada güncel olarak yer alacaktır.
Takım Çalışması ve Takım Üyesi Değerlendirmesi
Öğrenciler kendi takımlarının her bir üyesini projedeki performansına göre değerlendireceklerdir. Her bir öğrenci 100 puanı kendisi de dahil olacak şekilde takım arkadaşlarına dağıtacaktır. Bu dağıtım öğrencinin her bir takım üyesinin projeye katkısını yansıtacak şekilde yapılacaktır. Puanlama, takım üyesinin projeye harcadığı zamanı değil, projeye olan katkısını ölçecek şekilde yapılmalıdır. Katkıdan kasıt, fikir geliştirme, araştırma, analiz, yazı yazma, sözlü sunum, rapor yazma vb.’dir. Eğer takım çalışması iyi ise o zaman öğrenciler aynı puanı diğer takım üyelerine verebilirler. Ancak bazı takım üyeleri kendi yapmaları gerekeni yerine getirmediyse bu durumda puanlar eşit olmayan bir şekilde dağıtılacaktır.
Tüm takım üyeleri tarafından verilen puanlar ders hocası tarafından kümülatif hale getirilecektir. Her bir öğrenci kendi takım arkadaşlarının ve kendisinin verdiği puana göre bir takım çalışması katkı puanı alacak, ama bu puanın nasıl oluştuğu (kimin kime kaç puan verdiği bilgisi) öğrenciler ile paylaşılmayacaktır).
Takım üyeleri arasında bir konsensüs oluşmadığı zamanlarda; örneğin üç öğrencinin puanları eşit dağıtması ve bir öğrencinin farklı puanlama yapması gibi bir durumda, hoca kendi muhakemesini kullanarak takım katkı puanı hesaplayacaktır. Bu hesaplama esnasında takım üyeleri ile görüşmesi gerekebilir.
Eğer birbiri ile çelişen puanlamalar söz konusu ise hoca büyük ihtimalle takım üyeleri ile mülakat yapacak ve ona göre puanlama yapacaktır.
Geçmiş tecrübeler çoğu takımın puanlarını eşit olarak dağıttıkları şeklindedir. Takım çalışmasının proje notunu etkilediği durumlar azınlıkta bulunmaktadır. Bu puanlamanın amacı takımlarına destek olmayan takım üyelerinin hak etmedikleri puanı almanın önüne geçmektir. Aynı zamanda, bazı öğrencilerin payından çok daha fazlasını yapmaları durumunda öğrencinin puanının daha da yukarıya taşımak mümkün olacaktır.
Takım değerlendirmesinin puanlaması sizin proje puanınıza direkt etki edecektir. Örneğin, takım puanı 30 üzerinden 25 ise ve sizin takım üyesi puanlamanıza göre ortalamanın altında bir katkıda bulunduğunuz gözüküyorsa, sizin proje puanınız 25’ten küçük olacaktır. Bu düşürümün miktarı ile ilgili kolay bir kural yoktur. Derste ulaşılması hedeflenenler:
İlk kez programlamaya girecek katılımcılara programlamanın temellerini öğrenebileceği bir ortam sağlamak.
Temel veri yapılarına giriş yapmak
Nesne yönelimli programlamaya giriş yapmak
Python ve kütüphanelerini kullanarak tanımlayıcı (descriptive) ve tahminci (predictive) veri analizi yöntemleri geliştirebilmek
Python ve kütüphanelerini kullanarak görselleştirme projelerini yapabilmek
Python ve kütüphanelerini kullanarak uçtan uca, veri yükleme, veri ön işleme, veri dönüşümü, veri modellemesi ve veri görselleştirmesi işlemlerini yapabiliyor olmak.
Ders İzlencesi:
Hafta 1: Derse giriş, yazılımların tanıtılması, ders izlencesi ve tanışma: temel programlama teknikleri, değişken, döngülere giriş
Hafta 2: Yapısal programlamaya (structural programming) giriş : koşullar (if, else, elif:) for döngüleri, range fonksiyonu, ve fonksiyon kavramına ( def f(x): ) giriş ve uygulamaları
if, else ve elif kullanımı ve koşullar : untitled.py
If kavramı, kullanıcıdan sayı okumak ve int değerine dönüştürmek. Verilen bir 100’lük notun harf notuna dönüşümü örneği: ikinci.py
Döngü kavramı ve while, for döngüleri: ucuncu.py
range ve liste kavramları ve for döngüsünü kullanarak ortalama, toplam hesaplama: dort.py
Kullanıcıdan -1 girilene kadar sayı alan ve bu sayıların toplamını döndüren kod (break ve continue kavramları): bes.py
Fibonacci serisini hesaplayan fonksiyon: alti.py
Faktöriyel ve Kombinasyon hesaplayan fonksiyonlar: yedi.py
değişken ve liste çağrılması ve fonksiyon içerisinde yapılan değişiklerin çağrılan yere etkisi (kopyalayarak çağırma ve referans ile çağırma (call by value, call by reference) kavarmları: sekiz.py
bir liste alarak listedeki sayilarin toplamini döndüren fonksiyon : dokuz.py
Parametre sayısı belirsiz parametreyi alıp işleyen fonksiyon ( *l ) : on.py
Hafta 3: Veri yapılarına giriş (Data structures): temel veri yapılarının çalışma mantığı ve kullanım alanları, diziler, listeler, yığın (stack), sıra (queue), ağaçlar (trees) , haritalar (maps), v.b. kavramlar.
liste_giris.py : listelerin veri yapısı olarak kullanılması, temel liste fonksiyonları, çok boyutlu diziler ve listeler listesi kavramı
Kume: kümeler (sets)
sozluk.py: sözlük (dictionary)
sorular.py: Derste çözülen örnek sorular
Hafta 4: Nesne Yönelimli programlamaya giriş (object oriented programming) : Nesne, kalıtım (inheritance), kapsülleme (encapsulation), çok şekillilik (polymorphism) v.b. kavramlar.
Hafta 4 (Devam): Veri analizine giriş ve veri kümelerinin yönetilmesi / yüklenmesi
Ödev 3:Kaggle üzerinde birer hesap açınız ve ayrıca şu tutorial’da bulunan adımları 4. bölüme kadar (4. bölüm hariç) yapınız ve kodlarınızı ve çıktılarınızı yollayınız: tutoriala erişmek için tıklayınız
Derste Yazılan Kodlar (Kitabın 2. Bölümündeki ilk örneği (bitli/usa.gov veri kümesi ile olanı) yaptık ve çalıştırdık. Notlanmayacak bir ödev olarak yine kitabın 2. bölümündeki diğer 2 veri kümesini çalıştırmanızı tavsiye ederim.
Hafta 5: NumPy temelleri ve temel dizi analizi, vektörize hesaplamalar, dosya işlemleri ve doğrusal cebir (linear algebra), rasgele sayı (random number) üretimi
Hafta 10: SCI-KIT Learn Kütüphanesine giriş ve makine öğrenme algoritmaları (Rapid Miner, Knime ve Python kütüphanelerinin karşılaştırmalı çalıştırılması)
Yazılan Örnek kodlar (cinsiyet excel dosyasından makine öğrenmesi ve sınıflandırma örnekleri), aşağıdaki algoritmalar için çalışmaktadır.
Görev 1: Titanic veri kümesini yükleyerek derste üzerinden geçilen algoritmalardan en az birisi ile hayatta kalan veya kalmayanları tahmin etmeye (sınıflandırmaya) çalışın.
Görev 2: Derste işlenen bütün algoritmaları deneyin ve hangisinin en başarılı olduğunu yorumlayın (bir iki satır yazarak anlatın).
Görev 3: Bu işlemler sırasında bütün verileri (sayısal veya nominal) kullanın (herhangi bir kolonu dışarıda bırakmayın, eksik veya kirli veri varsa önizlemeye tabi tutun, kullandığınız algoritma, veri tipi ile uyumlu değilse veriyi uyumlu hale dönüştürün).
Hafta 11 ve Sonrasını içeren kodlar: indirmek için tıklayınız:
SCI-Kit Learn ile a priori algorithması ve birliktelik kural çıkarımı
Bölütleme-Kümeleme örnekleri ve kodları (clustering)
Hata ölçüm yöntemleri : Root Mean Square Error (RMSE), R2 Score , RAE, MAE
K-Means Algoritması ve Kodlaması
k-Fold Cross Validation ve Leave One Out yöntemleri
Linear Modeller ve Linear Regression, Polynomial Regression
Hafta 14: Pythonun farklı kullanım alanları, web ve diğer ortamlarda Python kullanımı ve kütüphaneleri:
Some parts of the course is related to Machine Learning, Data Science, Data Mining, Pattern Recognition, Natural Language Processing, Statistics, Logic, Artificial Neural Networks and Fuzzy Logic, so you can read any [text] books about the topics.
Class 1, Jan 30 : Introduction : Course Demonstration Slides, Introduction Slides
Class 2, Feb 1: Agents
Class 3, Feb 6: Search
Class 4, Feb 8: Introduction to Scheme 1, Search Homework 1 (Due Date: TBA)
Class 5, Feb 13: Heuristic Search
Class 6, Feb 15: Scheme Practice 2, Heuristic Homework 2 (Due Date: TBA)
Class 7, Feb 20: Constraint Satisfaction Problems
Class 8, Feb 22: Scheme Practice 3, CSP Homework 3 (Due Date: TBA)
Class 9, Feb 27: Game Playing
Class 10, Mar 1: Scheme Practice 4, Game Homework 4 (Due Date: TBA)
Class 11, Mar 6: Midterm
Class 12, Mar 8: Midterm Solutions
Mar 13, 15: No Classes , Spring Recess
Class 10, Mar 20: Logic
Class 11, Mar 22: First Order Logic
Class 12, Mar 27: Inference in First Order Logic
Class 13, Mar 29: Scheme Practice 5, Logic Homework 5 (Due Date: TBA)
Class 14, Apr 3: Uncertainity and Fuzzy Logic
Class 15, Apr 5: Machine Learning and Problems
Class 16, Apr 10: Supervised / Unsupervised Learning and Classification / Clustering Problems, k-nn and k-means
Class 17, Apr 12: Naive Bayes, Decision Trees, Rule Based Learning, Error Calculation
Class 18, Apr 17: Scheme Practice 6, ML Homework 6 (Due Date: TBA)
Class 19, Apr 19: Prediction, Regression and Association Rule Mining
Class 20, Apr 24: Artificial Neural Networks
Class 21, Apr 26: Natural Language Processing
Class 22, May 1: Final Exam
Class 23, May 3: Final Exam Solutions
Collaboration Policy: You may freely use internet resources and your course notes in completing assignments and quizzes for this course. You may not consult any person other than the professor when completing quizzes or exams. (Clarifying questions should be directed to the professor.) On assignments you may collaborate with others in the course, so long as you personally prepare the materials submitted under your name, and they accurately reflect your understanding of the topic. Any collaborations should be indicated by a note submitted with the assignment.
Introduction: The Internet has transformed society, opening up communication channels never dreamed of by previous generations. This course introduces students to the structure, design, and operation of the Internet, beginning with the electronic and physical construction of networks and basic network protocols. It addresses personal safety online, how email and Web browsers work, and the design of simple Web pages. Along the way it explores the historical and societal implications of this new medium.
Optional / also recommended (on reserve in Young library):
How The Internet Works, by Preston Gralla: Contains detailed labeled diagrams of many internet-related topics.
Basics of Web Design by Terry Felke-Morris: Contains detailed information on web page design and specific aspects of HTML, aimed at beginners. The more advanced portions of this book will also be useful if you take CSC 105.
Web 101, by Wendy Lehnert and Richard Kopec, which was used for this course in previous semesters.
In addition to the texts above, Wikipedia usually contains accurate information focused on specific topics relating to the Internet.
I2N = Introduction to Networking: How the Internet Works
LWD = Learning Web Design: A Beginner’s Guide to HTML, CSS, JavaScript, and Web Graphics
P&IS = How Personal & Internet Security Work
WtIW = How the Internet Works
BoWD = Basics of Web Design
W101 = Web 101
Grading
Assignment
Weight
Homework sets
50%
Project
50%
Collaboration Policy: You may freely use internet resources and your course notes in completing assignments and quizzes for this course. You may not consult any person other than the professor when completing quizzes or exams. (Clarifying questions should be directed to the professor.) On assignments you may collaborate with others in the course, so long as you personally prepare the materials submitted under your name, and they accurately reflect your understanding of the topic. Any collaborations should be indicated by a note submitted with the assignment.
A.An opportunity assessment plan is NOT a business plan. Compared to a business plan, it should:
Be shorter
Focus on the opportunity, not the venture
Have no computer-based spreadsheet
Be the basis to make the decision on whether to act on an opportunity or wait until another, better opportunity comes along
B.It should include:
1.A description of the product or service
a.What is the market need for the product or service?
b.What are the specific aspects of the product or service (include any copyright, patent or trademark information)?
c.What competitive products are available filling this need?
What are the competitive companies in this product market space? Describe their competitive behavior
e.What are the strengths and weaknesses of each of your competitors?
f.What are the unique selling propositions of this product or service?
g.What is the mission of the new venture?
h.What development work has been completed to date?
i.What patents might be available to fulfill this need?
2.An assessment of the opportunity:
a.What market need does it fill?
b.What is the size and past trends of this market?
c.What is the future growth and characteristics of this market?
d.What social condition underlines this market need?
e.What market research data can be marshaled to describe this market need?
f.What does the international market look like?
g.What does international competition look like?
h.What are total industry sales over the past five years?
i.What is anticipated growth in this industry?
j.How many new firms have entered this industry in the past three years?
k.What new products have been recently introduced in this industry?
l.What is the profile of your customers?
m.Where is the money to be made in this activity? (The activity that interests you most may be just off center from where the money to be made from this opportunity will be located.)
3.Entrepreneurial self-assessment and the entrepreneurial team:
a.Why does this opportunity excite you?
b.What are your reasons for going into business?
c.Why will this opportunity sustain you once the initial excitement subsides?
d.How does it fit into your background and experience?
e.What experience do you have and/or will you need to successfully implement the business plan?
f.Why will you be successful in this venture?
4.What needs to be done to translate this opportunity into a viable venture?
a.Examine each critical step.
b.Then think about the sequence of activity and put these critical steps into some expected sequential order.
c.How much time and how much money will each step require?
d.If you cannot self-finance, where would you get the needed capital?
In today’s economies, entrepreneurship is the engine of economic growth and prosperity. It is important for you to understand the underlying principles and concepts about entrepreneurship and the entrepreneurial process. This course covers the personal characteristics and qualities of the entrepreneur, innovation, creativity, opportunity assessment, and the role of entrepreneurship in developed and developing economies. Aspects of the family business, an important part of every economy, are also covered to provide an understanding of their role in a developed or emerging economy.
One of the key issues in successfully starting and growing a venture, particularly if outside capital is needed, is to create a global business plan. The development of a business plan and all of its components with particular focus on the marketing plan, financial plan, production plan, and organizational plan are presented. The various organizational structures available are discussed in terms of their applicability as well as important legal issues. The sources of capital and how to obtain them, starting, managing and growing a new venture, new venture valuation, and building a lasting venture are also discussed. Each person is to develop an opportunity assessment plan and a business plan. The business plan will be presented to venture capitalists and other investors for funding possibilities. Lectures, discussions, cases, and a few guest speakers will make this class a robust, valuable learning experience.
The primary goal of this course is to provide an understanding of entrepreneurship and the global business plan. This course will broaden a basic understanding obtained in the functional areas as they apply to new venture creation and growth, the business plan, and obtaining funding.
Learning Outcomes
1. Integrate functional area material as it applies to starting a new venture and its growth.
2. Develop an understanding of the role and activities of entrepreneurship in a global setting.
3. Provide an opportunity to evaluate your own entrepreneurial tendencies and ability to create a global business plan.
4. Understand all aspects of developing and submitting a business plan.
5. Understand the various capital sources and the process of obtaining outside funding.
Teaching Method(s)
The following teaching methods are used in this course: lectures, presentations, questions and answers, in-class discussions. Students are expected to read the assigned material before coming to the class. Students should also follow the instructor’s lectures by taking notes in class and contribute to in-class discussions. Students are waited to prepare a business plan and present it for potential investors.
Assessment Criteria
Assessment Component
Weight in Assessment (%)
Submissions
20
Presentations
40
Project
40
Total
100 %
WEEKLY PLAN
Weeks
Material
1
Entrepreneurship and Entrepreneurial Mindset
2
Corporate Entrepreneurship
3
Entrepreneurial Strategy: Generating and Exploiting New Entries
4
Creativity and Business Idea
5
Identifying and Analyzing Domestic and International Opportunities
6
Protecting the Idea and Other Legal Issues
7
Apr. 6 2016, Business Plan
8
Apr. 13 2016, Marketing Plan
9
Apr, 20 2016, Organizational Plan (Deadline for submission of project proposals)
10
Apr, 27 2016, Financial Plan
11
May, 4 2016, Sources of Capital (Deadline for submission of project reports)
12
Business Plan Presentations to Sources of Funding
13
Business Plan Presentations to Sources of Funding
14
Business Plan Presentations to Sources of Funding
TEXTBOOK
Required Textbook
Hisrich, Robert D., Peters, Michael P. and Shepherd, Dean A., Entrepreneurship, 9th Edition (Chicago: McGraw-Hill/Irwin), 2013.
Required Submissions (Each of the Submissions has 2 weeks (14 days) deadline)
Mar. 23, 2016, Methods of creating new ideas. Demonstrate your understanding of methods : Brain Writing, Gordon Method, Delphi Method, Checklist Method (SCAMPER), Free Association, Forced Relationship, Collective Notebook Method, Attribute Listing, Big Dream Approach. Submission due to Mar 30, 2016.
Mar. 30, 2016, Identifying and Analysing Domestic and International Opportunities, Prepare an opportunity assessment plan, evaluate current micro and macro environment of your proposal, select a foreign market and prepare two opportunity assessment plans (one for Turkey and one for your selected foreign country). Answer the questionaries attached here.
Apr. 6, 2016, Prepare your business plan. Please remember that, there is no one size fits all formula for the business plans, but the provided check list can guide you and can be reach the checklist file from here.
Apr. 13, 2016, Prepare a marketing plan. Again the marketing plan can be in a very flexible format and again I am attaching a sample template with 15 Sections and you can reach the attachment from here.
Apr. 20, 2016, Prepare an organisational plan. Select one of three organisational structures and include all the attributes in the attached file.
Apr. 27, 2016, Prepare a financial plan. You can download the template file and prepare a fictive company financial plan and the attached file can be reached from here.
Recent Comments