Navigation

News

Courses

Quick Links

ΠΡΟΗΓΜΕΝΑ ΘΕΜΑΤΑ ΟΡΓΑΝΩΣΗΣ ΥΠΟΛΟΓΙΣΤΩΝ

Ακ. έτος 2009-2010, 8ο Εξάμηνο ΗΜ&ΜΥ

ΔΙΔΑΣΚΩΝ: Νεκτάριος Κοζύρης

ΓΡΑΦΕΙΟ: Κτήριο ΗΜ&ΜΥ, 2ος όροφος, Αίθουσα 21.7 και 21.34Β (Εργαστήριο Υπολογιστικών Συστημάτων)

ΤΗΛΕΦΩΝΟ: 210-772 1531 και 210-772 2279

E-MAIL: nkoziris@cslab.ece.ntua.gr

ΩΡΕΣ ΓΡΑΦΕΙΟΥ: ΘΑ ΑΝΑΚΟΙΝΩΘΟΥΝ ΣΤΟ ΜΑΘΗΜΑ

ΒΟΗΘΟΙ: Νίκος Αναστόπουλος (υπ. διδ), Κωστής Νίκας (PhD)

ΩΡΕΣ ΜΑΘΗΜΑΤΟΣ: Τρίτη 16:15-19:00 (ΑΜΦ3, Νέα Κτίρια) (Δευτέρα 16:00-18:00, extra μάθημα αν χρειαστεί σε συννενόηση με τους διδάσκοντες)

ΒΙΒΛΙΟ: Computer Architecture: A Quantitative Approach, 3rd Edition, John L. Hennessy and David A. Patterson, Morgan Kaufmann Publishers (μετάφραση, εκδόσεις Τζιόλα, 2005)
Επιπλέον, θα δοθούν σημειώσεις από τα βιβλία:
  1. Computer Organization and Design: The Hardware/Software Interface, 3rd Edition (David A. Patterson and John L. Hennessy), Morgan Kaufmann Publishers (υπάρχει και ελληνική μετάφραση της 3ης έκδοσης από τις εκδόσεις Κλειδάριθμος).
  2. Modern Processor Design: Fundamentals of Superscalar Processors, 1st Edition, John P. Shen, Mikko Lipasti, McGraw Hill, ©2005.
ΛΙΣΤΑ: advcomparch@lists.cslab.ece.ntua.gr (οδηγίες εγγραφής εδώ)

ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ: Αρχιτεκτονικές συνόλου εντολών γλώσσας μηχανής (Instruction Set Architectures), οργάνωση προηγμένων επεξεργαστών: μονάδα έλεγχου (control unit) και δίοδος δεδομένων (datapath), Αρχιτεκτονικές αγωγού (pipeline), οργάνωση ιεραρχίας μνημών (κρυφές μνήμες, μετάφραση εικονικών διευθύνσεων, ΤLB), αρχιτεκτονικές αγωγού πολλαπλών βαθμίδων μεταβλητής καθυστέρησης (multistage pipeline with variable latency), υπερβαθμωτές αρχιτεκτονικές αγωγού (superscalar pipelines), ΟΟΟ εκτέλεση, πρόβλεψη διακλάδωσης (branch prediction), υποθετική εκτέλεση εντολών (speculative execution), δυναμική δρομολόγηση εντολών, αρχιτεκτονικές μεγάλου μήκους λέξης (VLIW), παραλληλισμός σε επίπεδο εντολών γλώσσας μηχανής (ILP), πολυνηματικές αρχιτεκτονικές. Παραδείγματα σύγχρονων επεξεργαστών.

ΑΝΑΛΥΤΙΚΗ ΠΕΡΙΓΡΑΦΗ:
  1. Εισαγωγή
    • Επισκόπηση αρχιτεκτονικής αγωγού 5 βαθμίδων
    • Προβλήματα ροής σε αγωγούς
      1. Εξαρτήσεις δεδομένων (data hazards)
      2. Εξαρτήσεις ελέγχου (control hazards)
    • Επέκταση αρχιτεκτονικής αγωγού για υποστήριξη λειτουργιών πολλαπλών κύκλων

  2. Υπερβαθμωτές αρχιτεκτονικές αγωγού (superscalar architectures)
    • Τι είναι υπερβαθμωτές αρχιτεκτονικές αγωγού (κίνητρο σχεδίασης)
    • Περιγραφή υλοποίησης αρχιτεκτονικών αγωγού εκτέλεσης εντολών σε σειρά (in-order pipelines)

  3. Πρόβλεψη διακλάδωσης (branch prediction)
    • Στατικές τεχνικές πρόβλεψης απόφασης
    • Δυναμικές τεχνικές πρόβλεψης απόφασης
    • Τεχνικές πρόβλεψης διεύθυνσης-στόχου

  4. Δυναμική δρομολόγηση εντολών
    • Τι είναι δυναμική δρομολόγηση εντολών και ποια τα πιθανά προβλήματα
    • Αλγόριθμος Tomasulo - Παραδείγματα (out-of-order ολοκλήρωση εντολών)
    • Explicit register renaming

  5. Υποθετική εκτέλεση εντολών
    • Προβλήματα της out-of-order ολοκλήρωσης εντολών
    • Επέκταση αλγορίθμου Tomasulo με χρήση Reorder Buffer για in-order ολοκλήρωση εντολών-παράδειγμα
    • Επέκταση υπερβαθμωτών αρχιτεκτονικών αγωγού για out-of-order εκτέλεση εντολών
    • Αξιολόγηση μεθόδων βελτίωσης επίδοσης της αρχιτεκτονικής αγωγού

  6. Πολυνηματικές αρχιτεκτονικές αγωγού
    • Περιορισμοί παραλληλισμού επιπέδου εντολών (instruction level parallelism) - εκμετάλλευση παραλληλισμού σε επίπεδο νημάτων (thread level parallelism)
    • Περιγραφή διαφορετικών προσεγγίσεων εκμετάλλευσης του TLP (coarse MT, fine MT, SMT)
    • Ανάπτυξη πολυπύρηνων αρχιτεκτονικών - Παραδείγματα (Niagara, Cell, Opteron)

  7. Κρυφές μνήμες (Caches)
    • Επισκόπηση βασικών εννοιών
    • Τεχνικές βελτιστοποίησης απόδοσης (software και hardware)
    • Ζητήματα διαμοιρασμού μνημών σε πολυνηματικές - πολυπύρηνες αρχιτεκτονικές

ΑΣΚΗΣΕΙΣ: Θα δοθούν σειρές ασκήσεων στο μάθημα. (xρήση branch predictors σε ένα κομμάτι κώδικα, ασκήσεις σε simulator [SESC, Simics]: π.χ. εκτέλεση κώδικα με διαφορετικές παραμέτρους (window size, superscalar width, branch predictors, in-order vs ooo), με διαφορετικές caches, simulation cmp/smt με παράμετρο τον αριθμό των threads) .

ΣΧΗΜΑ ΒΑΘΜΟΛΟΓΙΑΣ: Ο τελικός βαθμός υπολογίζεται σαν το άθροισμα του βαθμού των ασκήσεων και της τελικής εξέτασης. Το άριστα στη γραπτή εξέταση είναι 9 μονάδες, ενώ οι 2 σειρές ασκήσεων μετράνε 2 μονάδες.

Εγγραφή στη λίστα του μαθήματος

Μπορείτε να γραφτείτε στη λίστα του μαθήματος πηγαίνοντας εδώ και δίνοντας τα στοιχεία σας στο section "Subscribing to Advcomparch".